数学建模声音识别模型的建立与评价.docx
- 文档编号:2296680
- 上传时间:2022-10-28
- 格式:DOCX
- 页数:18
- 大小:213KB
数学建模声音识别模型的建立与评价.docx
《数学建模声音识别模型的建立与评价.docx》由会员分享,可在线阅读,更多相关《数学建模声音识别模型的建立与评价.docx(18页珍藏版)》请在冰豆网上搜索。
数学建模声音识别模型的建立与评价
《数学建模》论文报告
题目:
A题声音识别模型的建立与评价
参赛队员(数学与统计学院):
学号:
姓名:
联系电话:
声音识别模型的建立与评价
【摘要】
本文针对正常非正常开门(指盗窃开门等声音)的声音进行识别的问题,通过matlab的sound和plot采集到了正常和非正常开门的声音信号和声音波形图,附件中有正常开门声音(如正1.mat),非正常开门声音(如非1.mat),各40次开门,共80次开门声音数据。
将这些数据利用matlab的load函数载入到计算机内存,内存中变量有Fs和y等变量,其中Fs为采用频率,y为采用数据,通过建立数学模型将函数关系表示出来,并利用合适的时域或(和)频域特征表达声音信号,建立出特征向量。
针对问题一:
利用matlab中的sound函数,播放出声音信号,试听并比较正常和非正常开门声音的差别,利用plot函数绘制出具体的声音波形图,总结出差别在哪些方面,正常开门声音(如正1.mat)较短暂,波形图上各点分布较为分散;而非正常开门声音(如非1.mat)连续,波形图上各点分布也相对集中。
针对问题二:
利用合适的时域或(和)频域特征表达声音信号,建立特征向量,写出提取特征向量的具体方法和程序代码。
针对问题三:
建立声音识别模型(二分类模型),利用模型区分正常和非正常声音,评价模型的好坏。
针对问题四:
利用特征选择或变换,对特征向量进行优化,并利用参数优化技术优化模型的参数,使识别模型的准确率提高。
针对问题五:
若原始声音信号中有环境噪声(如白噪声),设y中叠加了一定幅值的白噪声(利用y1=y+(-0.15+0.3*rand(size(y)))*max(y)叠加噪声),对声音进行前期处理。
本文充分运用了高等代数、数理统计等知识,并通过MATLAB软件模拟的方法对理论数据进行了分析整合。
最后对模型的优缺点进行了评价,并给出了改进方向。
关键词:
声音识别、特征向量、二分类模型、MATLAB软件、神经网络
1问题重述
A题声音识别模型的建立与评价
随着家居智能化逐渐普及,智能冰箱、智能清洁机器人、智能电视等已步入平常老百姓家庭,但智能化的防盗门还处于研发阶段,未进入市场。
随着人们对家居安全意识的不断增强,对防盗、防抢和防砸的门禁系统的智能性提出更高的要求。
基于此,对正常和非正常开门(指盗窃开门等声音)的声音进行识别是智能防盗门的关键问题和技术,其具有广泛的应用前景和实用价值。
为了进行声音识别模型的建立,我们采集到了正常和非正常开门的声音,附件中有正常开门声音(如正1.mat),非正常开门声音(如非1.mat),各40次开门,共80次开门声音数据。
该数据可利用matlab的load函数载入到计算机内存,内存中变量有Fs和y等变量,其中Fs为采用频率,y为采用数据。
利用这些数据要求完成以下工作:
1.利用matlab中的sound函数,播放出声音信号,试听并比较正常和非正常开门声音的差别,利用plot函数绘制出具体的声音波形图,总结差别在哪些方面?
2.利用合适的时域或(和)频域特征表达个声音信号,建立特征向量,写出提取特征向量的具体方法和程序代码。
3.建立声音识别模型(二分类模型),利用模型区分正常和非正常声音,评价模型的好坏。
4.试利用特征选择或变换,对特征向量进行优化,并利用参数优化技术优化模型的参数,使识别模型的准确率提高。
5.若原始声音信号中有环境噪声(如白噪声),设y中叠加了一定幅值的白噪声(利用y1=y+(-0.15+0.3*rand(size(y)))*max(y)叠加噪声),如何对声音进行前期处理?
2模型假设
[1]假设原始声音信号中有环境噪声(白噪声)单一,无其他噪音干扰;
[2]假设采用的频率都为11025Hz来利用合适的时域或(和)频域特征表达声音信号;
[3]假设实验环境保持不变。
3符号说明
Fs采用频率
y采用数据
4问题的分析
本文针对正常非正常开门(指盗窃开门等声音)的声音进行识别的问题,通过matlab的sound和plot采集到了正常和非正常开门的声音信号和声音波形图,附件中有正常开门声音(如正1.mat),非正常开门声音(如非1.mat),各40次开门,共80次开门声音数据。
将这些数据利用matlab的load函数载入到计算机内存,内存中变量有Fs和y等变量,其中Fs为采用频率,y为采用数据,通过建立数学模型将函数关系表示出来,并利用合适的时域或(和)频域特征表达声音信号,建立出特征向量。
若原始声音信号中有环境噪声(如白噪声),设y中叠加了一定幅值的白噪声(利用y1=y+(-0.15+0.3*rand(size(y)))*max(y)叠加噪声),对声音进行前期处理。
5模型的建立与求解
5.1利用matlab中的sound函数,播放出声音信号,试听并比较正常和非正常开门声音的差别,利用plot函数绘制出具体的波形图
load('C:
\Users\Administrator\Desktop\2014校级数模竞赛赛题\A题\开锁声音采集\正1.mat')
sound(y,Fs)
plot(y)
图1正常开门声音(正1.mat)图
load('C:
\Users\Administrator\Desktop\2014校级数模竞赛赛题\A题\开锁声音采集\非1.mat')
sound(y,Fs)
plot(y)
图2非正常开门声音(非1.mat)图
由图像可总结出差别在于:
正常开门声与非正常开门声的区别在于,正常开门声是连续的短暂的,而非正常开门声是持续的开锁声音,用人的听觉很容易就能判断是否为正常的开门声音。
当我们运用matlab来分析声音时刻看出在频域内,语音信号的频谱分量主要集中在300~3400Hz的范围内。
如图1正常开门时域波形图等。
在时域内,两种声音信号都具有“短时性”的特点,即在总体上,开门声的特征是随着时间而变化的,但在一段较短的时间间隔内,语音信号保持平稳。
但从时域波形图的对比可看出两种开门声的区别,正常开门声有一组的峰值比其他的峰值明显要大很多,而非正常开门声有多组峰值相似。
5.2利用合适的时域或(和)频域特征表达个声音信号,建立特征向量,写出提取特征向量的具体方法和程序代码。
由于已假设采用的频率都为11025Hz所以需要利用合适的时域或(和)频域特征表达个声音信号。
在将开门声音进行数字化前,必须先进行防混叠预滤波,预滤波的目的有两个:
抑制输入信导各领域分量中频率超出fs/2的所有分量(fs为采样频率),以防止混叠干扰。
抑制50Hz的电源工频干扰。
这样,预滤波器必须是一个带通滤波器,设其上、下截止颜率分别是fH和fL,则对于绝人多数语音编译码器,fH=3400Hz、fL=60~100Hz、采样率为fs=8kHz;而对于开门声音的识别而言,当判断是否为正常开门声有重要意义。
当使用要求较高或很高的场合时fH=4500Hz或8000Hz、fL=60Hz、fs=10kHz或20kHz。
为了建立和提取不同开门声音的特征向量,必须经过采样和量化两个步骤,从而得到时间和幅度上均为离散的数字语音信号。
采样也称抽样,是信号在时间上的离散化,即按照一定时间间隔△t在模拟信号x(t)上逐点采取其瞬时值。
采样时必须要注意满足奈奎斯特定理,即采样频率fs必须以高于受测信号的最高频率两倍以上的速度进行取样,才能正确地重建波它是通过采样脉冲和模拟信号相乘来实现的。
下图时一段语音信号在采样频率11025Hz情况下的频谱图。
%语音信号时域频域分析
y=y(:
1);%我这里假设你的声音是双声道,我只取单声道作分析,如果你想分析另外一个声道,请改成y=y(:
2)
sigLength=length(y);
Y=fft(y,sigLength);
Pyy=Y.*conj(Y)/sigLength;
halflength=floor(sigLength/2);
f=Fs*(0:
halflength)/sigLength;
figure;plot(f,Pyy(1:
halflength+1));xlabel('Frequency(Hz)');
t=(0:
sigLength-1)/Fs;
figure;plot(t,y);xlabel('Time(s)');
y=y(:
1);
lg=length(y);
yx=(0:
(lg-1))*Fs/lg;
yx=yx(1:
lg/2);
%sound(y,fs);
figure
(1);
subplot(211);
plot(y);
title('原始图像');
subplot(212);
yf=abs(fft(y));
yf=yf(1:
lg/2);
plot(yx,yf);
ycq=zeros(1,lg);%先将抽取后的值全设为零
fori=1:
80:
lg;%通过循环,每隔80个点将抽取后的值赋值为原函数的
ycq(i)=y(i);%采样值
end
sound(ycq,Fs);
figure
(2);
subplot(211);
plot(ycq);
title('提取特征向量后的图像');
subplot(212);
ycqf=abs(fft(ycq));
ycqf=ycqf(1:
lg/2);
plot(yx,ycqf);
图3正常开门声提取的特征向量图
图4非正常开门声提取的特征向量图
5.3建立声音识别模型(二分类模型),利用模型区分正常和非正常声音,评价模型的好坏。
对于分类资料的分析,当要考察的影响因素较少,且也为分类变量时,常用列联表(contingencyTable)的形式对这种资料进行整理,并使用检验来进行分析,汉存在分类的混杂因素时,还可应用Mantel-Haenszel检验进行统计学检验,这种方法可以很好地控制混杂因素的影响。
但是这种经典分析方法也存在局限性,首先,它虽然可以控制若干个因素的作用,但无法描述其作用大小及方向,更不能考察各因素间是否存在交互任用;其次,该方法对样本含量的要求较大,当控制的分层因素较多时,单元格被划分的越来越细,列联表的格子中频数可能很小甚至为0,将导致检验结果的不可靠。
最后,检验无法对连续性自变量的影响进行分析,而这将大大限制其应用范围,无疑是其致使的缺陷。
标准的线性回归模型:
如果对分类变量直接拟合,则实质上拟合的是发生概率,参照前面线性回归方程,很自然地会想到是否可以建立下面形式的回归模型:
显然,该模型可以描述当各自变量变化时,因变量的发生概率会怎样变化,可以满足分析的基本要求,对计算方法进行了改进,用加权最小二乘法来对该模型进行拟合。
以Logit()为因变量,建立包含p个自变量的logistic回归模型如下:
以上即为logistic回归模型。
由上式可推得:
上面三个方程式相互等价。
通过大量的分析实践,发现logistic回归模型可以很好地满足对分类数据的建模需求,因此目前它已经成为了分类因变量的标准建模方法。
优势比:
如前所述,把出现某种结果的概率与不出现的概率之比称为比值(odds),即。
两个比值之比称为优势比(oddsRatio,简称OR)。
首先考察OR的特性:
若,则
若,则
若,则
显然,OR是否大于1可以用作两种情形下发生概率大小的比较。
5.4试利用特征选择或变换,对特征向量进行优化,并利用参数优化技术优化模型的参数,使识别模型的准确率提高。
1用MATLAB实现神经网络建模
MATLAB提供了许多工具箱,其中神经网络工具箱是其中之一,该工具箱由许多子程序组成
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 声音 识别 模型 建立 评价
![提示](https://static.bdocx.com/images/bang_tan.gif)