matlab的语音信号处理.docx
- 文档编号:30509963
- 上传时间:2023-08-16
- 格式:DOCX
- 页数:41
- 大小:384.38KB
matlab的语音信号处理.docx
《matlab的语音信号处理.docx》由会员分享,可在线阅读,更多相关《matlab的语音信号处理.docx(41页珍藏版)》请在冰豆网上搜索。
matlab的语音信号处理
本科毕业设计
题目:
基于Matlab的语音信号处理
姓名
学院信息与电气工程学院
专业通信工程
年级200级
学号
指导教师
2012年5月23日
独创声明
本人郑重声明:
所呈交的毕业论文(设计),是本人在指导老师的指导下,独立进行研究工作所取得的成果,成果不存在知识产权争议。
尽我所知,除文中已经注明引用的内容外,本论文(设计)不含任何其他个人或集体已经发表或撰写过的作品成果。
对本文的研究做出重要贡献的个人和集体均已在文中以明确方式标明。
此声明的法律后果由本人承担。
作者签名:
二〇一二年五月二十日
毕业论文(设计)使用授权声明
本人完全了解鲁东大学关于收集、保存、使用毕业论文(设计)的规定。
本人愿意按照学校要求提交论文(设计)的印刷本和电子版,同意学校保存论文(设计)的印刷本和电子版,或采用影印、数字化或其它复制手段保存论文(设计);同意学校在不以营利为目的的前提下,建立目录检索与阅览服务系统,公布论文(设计)的部分或全部内容,允许他人依法合理使用。
(保密论文在解密后遵守此规定)
论文作者(签名):
二〇一二年五月二十日
毕业设计选题报告
姓名
性别
男
学院
信息与电气工程学院
年级
2008级
学号
200
设计题目
基于Matlab的语音信号处理
课题来源
教师推荐
课题类别
应用研究
选做本课题的原因及条件分析:
随着现代科学技术和计算机技术的发展,除了人与人的自然语言的沟通,人机对话和智能机领域也开始使用语言。
这些人造的语言拥有词汇,语法,语法结构和语义内容等。
控制论创始人维纳在1950年曾经指出:
“通常,我们把语言仅仅看做人与人之间的通信手段,但是,要使人向机器、机器向人及机器向机器讲话,那也是完全办得到的。
在人机对话中使用的语言为数字语音信号,要想更充分的了解语音信号,那么对语音信号的分析就必不可少了。
此次设计为基于Matlab的语音信号处理,通过Matlab的仿真绘图,我们可以清楚的了解到语音信号的特性,从而设计出更好的人机语言。
指导教师意见:
此毕业设计对语音信号的特性做了详细的分析,让我们能直观的看到语音信号的各个特性,如短时能量函数,短时自相关函数,基音周期和功率谱等。
选题内容较为合理,有较好的研究价值,对深入的学习语音信号,了解语音信号有很大的帮助,符合设计相关的要求,同意选题。
签名:
年月日
院(系)毕业论文(设计)领导小组意见:
(公章)
年月日
毕业设计任务下达书
学院信息与电气工程学院专业通信工程学号2008000000姓名00000
现将毕业设计任务下达书发给你。
毕业设计任务下达书内容如下:
一、毕业设计题目
基于MATLAB的语音信号处理
二、主要内容
1.本文基于Matlab的语音信号处理包括短时能量分析、短时自相关分析、AMDF法提取基音周期、谱估计等;
2.论文设计,参考文献的简介,作者简单介绍等;
3.程序模块功能设计,完成各个功能所需代码。
三、具体要求
设计当中借鉴参考文献的内容要在正文当中标注清楚,外文资料翻译部分要做到准确无误,所查阅文献要确保是正版权威的文献,写作时要严格按照大学毕业论文的格式来写,同时还要保证在设计过程中不抄袭,杜绝学术造假现象。
正文内容的字数要达到8000字及以上。
四、主要参考文献
[1]张雪英.数字语音处理[M].北京:
电子工业出版社,2010.
[2]薛年喜.MATLAB在数字信号处理中的应用[M].北京:
清华大学出版社,2003.
[3]胡航.语音信号处理[M].哈尔滨:
哈尔滨工业大学出版社,2000.
五、进程安排
阶段
起止日期
主要内容
准备开题阶段
2011.11.18-2012.3.7
熟悉选题,查找阅读相关资料。
设计实现阶段
2012.3.8-2012.4.30
根据选题要求提取各种用信息,完成论文总体框架。
说明书完成阶段
2012.5.1-2012.5.20
修改论文,在老师指导下调试程序,完成总体设计。
答辩阶段
2012.5.21-2012.5.27
在老师指导下进行最后一次精心修改,完成了终稿。
六、毕业设计任务下达书于2012年1月6日发出。
毕业设计应于2012年5月20日前完成后交指导教师,由指导教师评阅后提交毕业设计答辩委员会。
七、毕业设计任务下达书一式两份,一份给学生,一份留学院存档。
指导教师:
签发于2012年1月6日
分管院长:
签发于年月日
毕业设计开题报告
姓名
性别
男
学
院
信息与电气工程学院
年级
2008级
学号
2008
预计
完成
时间
2012.5.20
设计题目
基于Matlab的语音信号处理
课题来源
教师推荐
课题类别
应用研究
指导教师
白艳梅
毕业设计实施方案:
第一阶段:
开题在做好需求分析的基础上,深入了解语音信号处理的知识,学会应用MATLAB对语音信号进行分析;
第二阶段:
综合分析完成语音信号处理论文的内容设计,完成MATLAB对语音信号分析的编码仿真,并截取仿真结果;
第三阶段:
修改完善设计在初步完成的基础上,查看所做设计是否完善,功能是否欠缺,后充实内容,各种操作能否达到预期效果,如内容是否连贯,程序是否正确,能否正常运行等;
第四阶段:
完成设计,对完成的设计进行最后的试用并修改细节;
第五阶段:
完成论文,定稿。
设计主要内容(提纲):
1、语音信号的获取与分析;
2、主要进行语音信号的短时能量分析、短时自相关分析、AMDF法提取基音周期以及谱估计;
3、设计程序,完成各个分析所需的代码;
4、分析仿真结果,得出结论。
指导教师意见:
学生对于MATLAB较为熟悉,可以实现语音信号的基本仿真,整个实施方案过程合理清晰,步骤合理,阶段任务明确;设计内容完整、科学,符合设计的相关要求,已经具备了开题的条件,同意开题。
签名:
2012年3月12日
签名:
年月日
年月日
学院毕业论文(设计)领导小组意见:
(公章)
年月日
(签章)
年月日
毕业设计结题报告
姓名
性别
男
学院
信息与电气工程学院
年级
2008级
学号
20082
设计题目
基于Matlab的语音信号处理
课题来源
教师推荐
课题类别
应用研究
指导教师
白艳梅
本课题完成情况介绍(包括研究过程、实验过程、结果分析、存在的问题及应用情况等。
)
通过学习语言信号处理的相关课程,学习了语音信号处理的基础、原理、方法及应用,通过MATLAB对自己的录音进行了短时能量分析、自相关分析、AMDF法提取基音周期还有谱估计等。
通过此次毕业设计,我明白了只有准确分析并提取出语音信号的特征参数,才能够利用这些参数进行语音编码、语音合成等处理,因此基音周期的提取十分重要,AMDF法提取基音周期还存在一些缺陷,当语音信号的幅度变化过快时,AMDF法提取的基音周期精度下降,从而影响了识别的准确率,这有待于我更进一步的学习。
指导教师意见:
本此设计基本上完成了对语音信号的处理与仿真,通过软件的仿真了解了语音信号的的特征,如何对语音信号进行短时能量分析,短时自相关分析,AMDF法提取基音周期和谱估计等,从而深入了解了语音信号的特性,对语音信号的处理有了更加直观的认识。
同意结题。
签名:
2012年5月23日
学院毕业论文(设计)领导小组意见:
(公章)
年月日
设计成绩
毕业设计成绩评定表
学院:
信息与电气工程学院学号:
20082312579
姓名
设计总成绩:
设计题目
基于Matlab的语音信号处理
指
导
教
师
评
语
评定成绩:
签名:
年月日
评
阅
人
评
语
评定成绩:
签名:
年月日
答
辩
小
组
评
语
答辩成绩:
组长签名:
年月日
注:
1、论文(设计)总成绩=指导教师评定成绩(50%)+评阅人评定成绩(20%)
+答辩成绩(30%)
2、将总成绩由百分制转换为五级制,填入本表相应位置。
目录
1引言1
2本文主要工作及仿真软件MATLAB3
2.1本文主要工作3
2.2MATLAB简介和选择MATLAB的原因3
3语音信号的特点4
4语音信号的处理4
4.1语音信号分析技术4
4.2语音信号的时域分析5
4.2.1MATLAB的简单应用5
4.2.2短时能量分析7
4.2.4短时自相关分析8
4.3AMDF法提取基音周期11
4.3.1基音提取11
4.3.2AMDF法提取基音周期11
4.4功率谱估计13
4.4.1功率谱估计的概述13
4.4.2直接法13
4.4.3间接法15
4.4.4Welch法17
5结束语18
参考文献18
致谢19
基于Matlab的语音信号处理
XXX
(信息与电气工程学院,通信工程专业,2008级2班,2008200000)
摘要:
语音信号处理与数字信号处理、心理学、语言学、模式识别、计算机科学和人工智能等相结合的交叉学科,是目前发展最为迅速的信息科学研究领域中的一个,是目前极为活跃和热门的研究领域,其研究设计一系列前况科研课题,且处于迅速发展之中,其研究成果具有重要的学术及应用价值。
语音采集和分析仪器的小型化、智能化、数字化以及多功能化的发展越来越快,分析速度较以往也有了大幅度的高。
本文通过应用MATLAB对语音信号进行处理仿真,包括短时能量分析、短时自相关分析、AMDF法提取基音周期、谱估计等。
关键词:
语音信号;语音信号处理;Matlab
BasedonMatlabDigitalProcessingofSpeechSignals
Abstract:
Thevoicesignalprocessinganddigitalsignalprocessing,cross-discipline,acombinationofpsychology,linguistics,patternrecognition,computerscienceandartificialintelligenceisoneofthefastestgrowingareaofscientificresearchisextremelyactiveandpopularareasofresearch,researchanddesignaseriesofformerstatusofresearchprojects,andintherapiddevelopmentofitsresearchresultshaveimportantacademicvalue.Speechacquisitionandanalysisinstrumentminiaturization,intelligence,digitalandmulti-purposeofthedevelopmentoffasterandfasteranalysisspeedthaninthepasthasalsobeensubstantial.InthispaperthespeechsignalprocessingusingMATLABsimulation,includingshort-termenergyanalysis,short-termautocorrelationanalysis,AMDFmethodtoextractthepitchperiod,spectralestimation,andsoon.
Keywords:
voicesignal;digitalprocessingofppeechpignals;matlab
1引言
人类交换信息最方便的、最快捷的一种方式是语言,在高度发达的信息社会中,用数字化的方法进行语音的识别、合成、增强、传送和储存等是整个数字化通信网中最重要、最基本的组成部分之一。
数字电话通信、高音质的窄带语音通信系统、智能机器人、声控打字机、语言学习机、自动翻译机等,都要用到语音信号处理技术,随着现在集成电路和微电子技术的飞速发展,语音信号处理系统逐步走向实用化。
[1]
语音信号处理是一个新兴的交叉学科,是语音和数字信号处理两个学科的结合产物。
与认知科学、心理学、语言学、计算机科学、模式识别和人工智能学科有着密切的联系。
语音信号处理技术的发展依赖于这些学科的发展,语音信号处理技术的进步也将促进这些领域的进展。
语音信号处理目的是得到一些语音特征参数,以便高效的传输或存储,或通过某种处理以达到特定目的,如语音合成,辨识出讲话者、识别出讲话的内容等。
随着现代科学技术和计算机技术的发展,除了人与人的自然语言的沟通,人机对话和智能机领域也开始使用语言。
这些人造的语言拥有词汇,语法,语法结构和语义内容等。
控制论创始人维纳在1950年曾经指出:
“通常,我们把语言仅仅看做人与人之间的通信手段,但是,要使人向机器、机器向人及机器向机器讲话,那也是完全办得到的”[1],一般的语音信息交换大致可以分为三类:
人与人之间的语音通信:
它包括语音压缩与编码、语音增强等。
第一类人机语言通信的问题,指机器讲话、人听话的研究,即语音合成。
第二类人机语言通信的问题,指人讲话、机器听话的情况,即语音识别和理解。
上述这些应用程序构成的语音信号处理技术的主要内容。
早在两千多年前,人们便进行了语言的学习。
因为缺乏适当的设备,长期以来,一直由耳听和用口模仿来研究。
因此,这种语言的研究通常被称为“口耳学校,所以对于语言仅仅停留在定性描述上。
语音信号处理的研究可以追溯到1876年贝尔电话的发明,其在真正意义上首次用声电,电声转换技术实现了远距离语音传输。
1939年HomerDudley提出并研制成功第一个声码器,奠定了语音产生模型的基础。
这项发明在语音信号处理领域具有划时代意义。
19世纪60年代,赫姆霍兹用声学的方法对元音和唱歌进行研究,奠定了基础语言的声学基础。
在20世纪40年代,一种语言声学的专用仪器–语谱图仪问世。
它可以让你把语音的时变频谱用语图表示出来,得到一个“可见的语言”。
1984年Haskins实验室研制成功“语音回放机,此仪器可以自动转换手工绘制的语谱图成为语言,并进行语音合成。
在20世纪50年代对语言产生的声学理论有了系统描述。
随着计算机的出现,语音分析技术可以在电子计算机上进行,在此基础上,语音信号处理无论是在基础研究或在技术应用,都已取得了突破性进展。
以下讨论的语音信号的三个主要分支的发展和当前状态处理(语音合成,语音编码和语音识别技术)
语音合成技术,第一个合成器是在1835年由W.vonKempelen发,经过Weston改进的机械讲话机。
机器完全模仿人的生理过程,分别应用了特别设计的哨和软管模拟肺部空气动力、模拟口腔。
HomerDudley在1939年发明了第一台电子语音合成器,它不是一个简单的生理过程的模拟,而是在电子电路基础上来实现语音产生源–滤波器理论。
语音编码的目的就是在保证一定语音质量的前提下,尽可能降低编码比特率,以节省频率资源。
[1]语音编码技术的研究开始于1939年,HomerDudley提出并实现了在低带宽电话电报上传输语音信号的通道声码器,第一个研制成功了语音编码技术。
到20世纪70年代,国际电联于1972年发布了64kbit/s脉冲编码调制(PCM)语音编码算法的G.711建议,它被广泛应用于数字交换机、数字通信等领域,从而占据统治地位。
在1995年11月ITU-TSG15全会上共轭代数码激励线性预测(CS-ACELP)的8kbit/s语音编码G.729建议被通过,并于1996年6月ITU-TSG15会议上通过G.729附件A:
减少复杂度的8kbit/sCS-ACELP语音编解码器,正式成为国际标准。
这几种语音编码算法也成为分组化语音通信的可选算法。
[1]
语音识别的研究开始于20世纪50年代贝尔实验室的Audry系统,它是第一个可以识别10个英文数字的语音识别系统,1959年Fry和Denes等人采用频谱分析和模式匹配来进行识别决策构建音素识别器来辨别9个辅音和4个元音。
20世纪60年代末单语音识别的研究取得实质性进展,并将其作为一个重要的课题。
一方面是因为计算机的计算能力有了迅速的提高,计算机能够提供实现复杂算法的硬件、软件;另一方面,数字信号处理在当时有了蓬勃发展,从而自20世纪60年代末开始引起了语音识别的研究热潮。
动态规划(DP)和线性预测编码(LPC)分析技术就是在这时期提出的,其中线性预测编码较好地解决了语音信号产生模型的问题,对语音识别、语音合成、语音分析、语音编码的研究发展产生了重大的影响。
在20世纪70年代末和80年代初,Buzo、Linda、Gray等人解决了矢量量化码本生成的方法,并将应用到语音编码中,从此矢量量化技术很快被推广应用。
从20世纪80年代开始,语音识别研究进一步深入,更多地追求从整体统计的角度来建立语音识别系统。
HMM技术就是一个典型技术。
在20世纪80年代末,美国卡内基梅陇大学用VQ/HMM实现997个词的非特定人连续语音识别系统SPHINX成为世界上第一个高性能的非特定人、大词汇量、连续语音识别系统。
这些研究让语音识别进入了新时代。
2本文主要工作及仿真软件MATLAB
2.1本文主要工作
本文简要介绍了语音信号处理的发展史以及语音信号处理分析方法,获取一段wav格式的声音文件,运用Matlab进行仿真分析,包括短时能量分析、短时自相关分析、AMDF法提取基音周期、谱估计等。
MATLAB是美国MathWorks公司出品的商业数学软件,用于数据可视化、算法开发、数值计算及数据分析以的高级技术计算语言和交互式环境,主要包括MATLAB和Simulink两大部分。
2.2Matlab简介和选择Matlab的原因
MATLAB产生于1982年,是一种效率高、功能强的数值计算和可视化计算机高级语言,它将信号处理、数值分析和图形显示结合一体,形成了一个极其方便又强大的操作环境。
通过MATLAB可以对数字化的语音信号进行时频域分析。
通过MATLAB可以方便地展现语音信号的时域及频域曲线,并且根据语音的特性对语音进行分析。
例如,请浊音的幅度差别、语音信号的端点、信号在频域中的共振峰频率、加不同窗和不同窗长对信号的影响、LPC分析、频谱分析等。
通过MATLAB可以对数字化的语音信号进行估计和判别。
例如,根据语音信号的短时参数,一级不同语音信号的短时参数的性质对一段给定的信号进行有无声和请浊音的判断、对语音信号的基音周期进行估计等。
通过利用MATLAB编程对语音信号进行处理。
由于MATLAB是一种面向科学和工程计算的高级语言,允许用数学形式的语言编程,又有大量的库函数,所以编程简单、编程效率高、易学易懂。
我们可以对信号进行加噪去噪、滤波、截取语音等,也可进行语音编码、语音识别、语音合成的编程等。
3语音信号的特点
通过采集大量语音信号的观察和分析,发现语音信号主要有下面两个特点:
在频域内,语音信号的频谱分量主要集中在300Hz~3400Hz的范围之内。
利用这个特点,可以用一个防混迭的带通滤波器将此范围内的语音信号频率分量取出,然后按8kHz的采样率对语音信号进行采样,就可以得到离散的语音信号。
在时域内,语音信号具有“短时性”的特点,即在整体上,语音信号的特征是随着时间变化而变化的,但在一段较短的时间间隔内,语音信号保持平稳。
在浊音段表现出信号的周期特性,在清音段表现出随机噪声的特征。
4语音信号的处理
4.1语音信号分析技术
语音信号的分析是语音信号处理的基础和前提,语音通信、语音合成和语音识别这些技术只有在分析出可表示语音信号本质特征的参数,才能利用这些参数进行高效的处理。
而且,语音信号分析的准确性和精确性也决定了语音合成的音质好坏。
因此,在语音信号处理应用中语音信号分析具有十分重要的地位。
语音分析中使用到的是“短时时间分析技术”。
之所以不能用处理平稳信号的数字信号处理技术对它进行分析,是因为语音信号的属性和特征是随时间变化而变化的,它是一个非平稳态的过程。
然而,由于不同的语音由口腔肌肉通过运动产生的声音,口腔肌肉运动的频率相对声音频率反应是很慢的,所以另一方面,虽然声音信号有时变性,但在短期的时间内,它的基本特征保持不变,即是相对稳定的,因此,可以将语音信号看成是一个准稳态过程,即语音信号具有短时平稳特性。
所以语音信号的分析和处理一般建立在短时的基础上,进行短时分析,将语音分成多段,每一段为一帧,帧长一般取10-30ms。
这样,每一帧的语音信号为稳定的,然后将每一帧的分析结果组成一个整体即为整体的语音信号特征参数。
[3]
根据分析参数的性质,语音信号分析划分成时域分析,频域分析,同态分析等,本文将简要介绍短时能量分析,短时自相关分析,AMDF方法提取基音周期,谱估计等。
4.2语音信号的时域分析
语音信号的时域分析是分析和提取语音信号的时域参数。
语音分析时,第一次接触到的且也是最直观的是时域波形。
语音信号本来就是时域信号,因此时域分析是最早的,也是最广泛使用的分析方法,这种方法是直接使用的语音信号时域波形。
通常用于时域分析基本的参数分析,如语音分割,预处理,大型分类。
这种分析方法的特点是:
(1)表示语音信号更直观,清晰的物理意义。
(2)实施相对简单,运算少。
(3)可以得到一些语音的重要参数。
(4)只使用一般的简单设备,如示波器。
语音信号时域参数包括短时能量,短时过零率,短时自相关函数和短时平均幅度差函数等等,这是一个基本的短时参数,在各种语音信号处理中都有重要的应用。
4.2.1MATLAB的简单应用
在语音信号处理中将会用到MATLAB,MATLAB是一种功能强大、效率高、交互性好的数值计算和可视化计算机高级语言,通过MATLAB可以对数字化的语音信号进行时频域分析。
通过MATLAB可以方便地展现语音信号的时域及频域曲线,并且根据语音的特性对语音进行分析。
例如短时能量分析,短时自相关分析等,通过MATLAB也可以对数字化的语音信号进行估计和判别。
例如AMDF法提取基音周期,谱估计等。
下面对一语音绘制其原始信号波形、原始信号频谱、原始信号幅值和原始信号相位,以此来简单介绍MATLAB的使用。
(注:
本文使用的是MATLAB2009)
打开MATLAB,单击文件(File),选择新建选项(New),在右弹窗选择建立空白M文件(BlankM-File)如图4.1;
图4.1MATLAB主界面
在打开的M文件里,将程序写入,注意输入法要用英文输入法。
将程序写入后,单机保存按钮,选择要保存的文件夹,保存好
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- matlab 语音 信号 处理