精品毕业论文设计基于虚拟仪器的语音识别算法研究.docx
- 文档编号:28967164
- 上传时间:2023-07-20
- 格式:DOCX
- 页数:58
- 大小:661.41KB
精品毕业论文设计基于虚拟仪器的语音识别算法研究.docx
《精品毕业论文设计基于虚拟仪器的语音识别算法研究.docx》由会员分享,可在线阅读,更多相关《精品毕业论文设计基于虚拟仪器的语音识别算法研究.docx(58页珍藏版)》请在冰豆网上搜索。
精品毕业论文设计基于虚拟仪器的语音识别算法研究
本科生毕业设计说明书(毕业论文)
题目:
基于虚拟仪器的语音识别
算法研究
毕业设计(论文)原创性声明和使用授权说明
原创性声明
本人郑重承诺:
所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。
尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得及其它教育机构的学位或学历而使用过的材料。
对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。
作者签名:
日 期:
指导教师签名:
日 期:
使用授权说明
本人完全了解大学关于收集、保存、使用毕业设计(论文)的规定,即:
按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。
作者签名:
日 期:
学位论文原创性声明
本人郑重声明:
所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。
除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。
对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。
本人完全意识到本声明的法律后果由本人承担。
作者签名:
日期:
年月日
学位论文版权使用授权书
本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。
本人授权 大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
涉密论文按学校规定处理。
作者签名:
日期:
年月日
导师签名:
日期:
年月日
指导教师评阅书
指导教师评价:
一、撰写(设计)过程
1、学生在论文(设计)过程中的治学态度、工作精神
□优□良□中□及格□不及格
2、学生掌握专业知识、技能的扎实程度
□优□良□中□及格□不及格
3、学生综合运用所学知识和专业技能分析和解决问题的能力
□优□良□中□及格□不及格
4、研究方法的科学性;技术线路的可行性;设计方案的合理性
□优□良□中□及格□不及格
5、完成毕业论文(设计)期间的出勤情况
□优□良□中□及格□不及格
二、论文(设计)质量
1、论文(设计)的整体结构是否符合撰写规范?
□优□良□中□及格□不及格
2、是否完成指定的论文(设计)任务(包括装订及附件)?
□优□良□中□及格□不及格
三、论文(设计)水平
1、论文(设计)的理论意义或对解决实际问题的指导意义
□优□良□中□及格□不及格
2、论文的观念是否有新意?
设计是否有创意?
□优□良□中□及格□不及格
3、论文(设计说明书)所体现的整体水平
□优□良□中□及格□不及格
建议成绩:
□优□良□中□及格□不及格
(在所选等级前的□内画“√”)
指导教师:
(签名)单位:
(盖章)
年月日
评阅教师评阅书
评阅教师评价:
一、论文(设计)质量
1、论文(设计)的整体结构是否符合撰写规范?
□优□良□中□及格□不及格
2、是否完成指定的论文(设计)任务(包括装订及附件)?
□优□良□中□及格□不及格
二、论文(设计)水平
1、论文(设计)的理论意义或对解决实际问题的指导意义
□优□良□中□及格□不及格
2、论文的观念是否有新意?
设计是否有创意?
□优□良□中□及格□不及格
3、论文(设计说明书)所体现的整体水平
□优□良□中□及格□不及格
建议成绩:
□优□良□中□及格□不及格
(在所选等级前的□内画“√”)
评阅教师:
(签名)单位:
(盖章)
年月日
教研室(或答辩小组)及教学系意见
教研室(或答辩小组)评价:
一、答辩过程
1、毕业论文(设计)的基本要点和见解的叙述情况
□优□良□中□及格□不及格
2、对答辩问题的反应、理解、表达情况
□优□良□中□及格□不及格
3、学生答辩过程中的精神状态
□优□良□中□及格□不及格
二、论文(设计)质量
1、论文(设计)的整体结构是否符合撰写规范?
□优□良□中□及格□不及格
2、是否完成指定的论文(设计)任务(包括装订及附件)?
□优□良□中□及格□不及格
三、论文(设计)水平
1、论文(设计)的理论意义或对解决实际问题的指导意义
□优□良□中□及格□不及格
2、论文的观念是否有新意?
设计是否有创意?
□优□良□中□及格□不及格
3、论文(设计说明书)所体现的整体水平
□优□良□中□及格□不及格
评定成绩:
□优□良□中□及格□不及格
(在所选等级前的□内画“√”)
教研室主任(或答辩小组组长):
(签名)
年月日
教学系意见:
系主任:
(签名)
年月日
基于虚拟仪器的语音识别算法研究
摘要
随着信息技术的快速发展,智能人机交互通信逐渐渗透到人们的日常生活之中,在许多电器的控制面板中,都加入了利用声音信息进行的人机交互功能,其中多数都具备语音提示的功能,这就使人机交互的效率得到了更大的提高。
本次设计将虚拟仪器技术用于语音识别系统,实现了仪器的软件化,真正体现了“软件就是仪器”的思想。
利用笔记本自带的声卡进行语音信号的采集,接着对语音信号进行数字化的转换后再做进一步的处理。
利用MATLAB中的小波工具包对采集到的语音信号进行小波消噪处理,并借助LABVIEW中提供的ScriptNode子VI连接主流算法即仿真分析软件MATLAB,充分发挥MATLAB强大的数据处理能力,虽然LABVIEW中提供了一些信息处理功能函数,但其毕竟功能有限,仍然无法满足部分用户对数值进行各种各样的计算和分析的需求。
而MATLAB尤其擅长数值分析和图像处理。
在这里我们利用MATLAB中的小波工具包,实现了利用小波的方法对含有杂声的语音信号进行噪声消除的工作。
由于小波具有多尺度,多分辨的特点,应用小波进行信号消噪处理是小波分析的一项重要应用。
文中首先介绍了语音识别技术的基本原理,分析了经常使用的线性预测倒谱系数和美尔频率倒谱系数,并选定美尔频率倒谱系数作为本系统中采用的语音特征参数;其次系统能够实现语音信号的自动采集;然后针对语音特征参数提取,结合LABVIEW的编程特点,利用多线程对特征参数进行提取并运算,将计算时间缩短了1/4;最后在分析语音识别系统主要需求的基础上,对识别系统的软硬件进行了设计,并对语音信号做噪声消除以及预处理后进行特征提取,利用不同语音独特的特征和模式匹配算法,实现说话人语音信号的最终识别。
关键词:
语音识别;LABVIEW;声卡;小波消噪;特征提取
Thespeechrecognitionalgorithmbasedonvirtualinstrument
Abstract
Withtherapiddevelopmentoftechnology,intelligenthumanandmachineinterfacesareusedinappliancesinpeople'snormallife.Currently,alotofapplianceshavethefunctionthatcangivewarningmessagestotheuserinsoundwhichimprovestheefficiencyofhumanandmachineinteraction.
Thisdesignisauseofvirtualinstrumentanddospeechrecognitionsystemdesign.Willthevirtualinstrumenttechnologyusedinspeechrecognitionsystem,realizedtheinstrumentofthesoftware,andreflectthe"softwareisinstrument"thought.Usenotesitselfwithsoundcardforvoicesignalcollection,thespeechsignaldigitalconversionandfurtherprocessing.MATLABwaveletinthetoolkitofcollectedavoicesignalwaveletdenoisingtreatment,andwiththehelpofLABVIEWprovidedintheScriptNodesub.viconnectthemainstreamalgorithmsimulationanalysissoftwareMATLAB,makefulluseofMATLABpowerfuldataprocessingcapabilities,eventhoughtheLABVIEWprovidessomeinformationprocessingfunctions,butlimitedafterall,stillcan'tmeetsomeuserdemandforvariouskindsofnumericalcalculationandanalysis.AndMATLABisespeciallygoodatnumericalanalysisandimageprocessing.HereweuseofMATLABwavelettoolkit,realizedbyusingwaveletmethodtocontaintheshortspeechsignalnoiseeliminationofwork.Duetothesmallwavehasmulti-scale,multi-resolutioncharacteristics,applicationofwaveletde-noisingsignalswhenprocessingofwaveletanalysisisakindofimportantapplications.
Thispaperintroducesthebasicprincipleofspeechrecognitiontechnology,andthenanalysessomefeatureparameterssuchasLinearPredictionCoefficients,LinearPredictionCepstralCoefficientsandMelFrequencyCepstralCoefficientsandchoosestheMFCCusedinthissystem;Followed,thispaperrealizesautomaticallyspeechsignalacquisition,andusesmulti-threadofLABVIEWtocalculatethefeatureparametersinaparallelwayandshort1/4ofthecalculatingtimewhichimprovetheefficiencyofthefeaturefunctionaltesting;Atlast,thispaperanalysesthemainrequirementsofthissystem,designsthehardwareandsoftwareindetailandchoosesthegraphicprogramminglanguageLABVIEWasthesoftwaredevelopmentplatformandthentheuseofdifferentspeechuniquefeatureandpatternmatchingalgorithm,realizevoicesignaltothefinalrecognition.
Keywords:
SpeechRecognition;Virtualinstrument;Soundcard;WaveletDenoisingandfeatureextractio
摘要I
AbstractII
目录IV
第一章绪论1
1.1本文的应用背景和研究意义1
1.2语音识别发展历史及现状3
1.3虚拟仪器简介5
1.4MATLAB语言7
1.5论文的主要内容及其结构10
第二章语音识别基本技术11
2.1语音信号的采集11
2.1.1语音识别系统基本框架11
2.1.2语音信号的采集12
2.1.3语音信号的数字化13
2.2语音信号预处理14
2.2.1预加重处理14
2.2.2分帧、加窗16
2.2.3端点检测17
2.3语音信号的特征参数提取20
2.3.1美尔频率倒谱参数及提取方法21
2.3.2差分倒谱系数提取方法22
第三章语音识别算法24
3.1模板匹配的方法24
3.1.1动态时间规整算法DTW24
3.1.2隐马尔可夫模型法HMM25
3.1.3高斯混合模型法GMM26
3.1.4矢量量化VQ26
3.1.5混合型算法28
3.2基于声学和语音学的方法28
3.3神经网络的方法29
第四章非特定人连续语音识别系统的实现30
4.1概述30
4.2非特定人连续语音识别系统设计与实现30
4.2.1语音信号的实时采集与小波消噪处理30
4.2.2语音信号的预处理33
4.2.3语音信号的特征提取36
4.3模板的建立与读取38
4.3.1建立模板38
4.3.2读取模板40
第五章结论41
第六章总结与展望42
6.1总结42
6.2展望42
参考文献43
致谢46
第一章绪论
语言是人类进行信息交流的最常用、最重要的手段,人类的语言和人的心理活动密切相关,是人们进行思想交流的重要方式,既高效又便捷。
随着现代社会的不断发展,科学技术的日益成熟,全自动机器逐渐被运用于各个领域,取代了很多原本依靠人来完成的工作,人们对机器的智能要求也越来越高,人机进行信息交互的手段也越来越便捷和迅速,因此语言交流自然而然的成为了首选。
人与机器的语言交流总体可分为三部分,
(1)让机器听懂人的语言
(2)进行语言组织(3)文字转化为声音输出。
语音识别研究的就是如何让机器听懂人的语音内容,同时辨别是否是主人所发出的指令,执行相应的操作。
1.1本文的应用背景和研究意义
语音识别技术是现代高科技信息领域的研究热点,对于信号处理的研究,从理论的产生到专业产品的系统开发应用已经经历了数十年,终于获得了极大的突破。
经过二十年的研究探索,语音识别技术取得了很大的发展。
就目前来说,该技术从实验室的实验性设计开发,逐渐进入到工厂的应用,估计在不远的将来,语音识别技术将遍布通讯行业,家电行业,医疗保健行业,家庭服务行业,汽车电子行业,消费性电子产品等各大领域。
它与自动拨号,健康和福利,生命支持系统和其他实际应用相互衔接,直接控制商业,制造业,金融业,运输业,旅游业,公安消防等工业生产部门和应用领域,该技术的日益成熟有望成为下一代的操作系统和应用程序的用户界面。
以下介绍语音识别技术的几大应用领域:
(1)查询语言的语音识别应用
语音识别可用于查询航班时间表,电话号码,巴士时间查询,火车车次查询,自动导游,天气预报,股票行情系统等。
目前在国际上的各大旅游景区已经开始逐步采用语音识别查询系统,其中最具代表性的是日本丰桥大学设计研发的“富士山旅游咨询系统”,该系统是一个比较实用的语音查询系统,此外它还可以采用问卷调查等方式,集成了自动语言的语音导览系统。
只要游客对该系统说话,标示清楚他们当前的所在位置和感兴趣的风景名称,系统会自动显示出最佳路线,实物图片和旅游计划等人性化的信息。
该系统不仅能提供英语和汉语查询,而且可以用其它语言来查询。
另一个例子是,利用语音识别的自动订票系统,只要站在预订系统前,说出搭乘的时间和地点,系统便会自动显示出符合要求的车费、班次和车票销售的记录,根据实际情况,用户可以做出最佳的选择。
1996年,美国卡内基梅隆大学计算机科学系开发的语言语音机票预订系统,在实践方面,就做出了有益的尝试[6]。
(2)语音识别技术在工业生产上的应用
在一些对人身有极大伤害(如地下,水深,辐射,高温环境下)、环境比较恶劣的地方,还有无人时难以实现工作的地方都可以运用相应的语音命令加以控制,通过远程,使用专门的语言,也就是语音控制系统,控制设备去完成工作,这就能用各种指令和命令,对作业现场进行实时控制和处理。
(3)语音识别技术在扶残扶弱方面的应用
为了帮助残疾人士由于肢体功能方面的缺陷而引起的动作不便,运用语音识别系统,则能对其给予一定的方便。
例如:
对于身体残疾的人或盲人,能够既准确又灵活地使用现代化设备是比较困难的,但是,如果有了语音控制系统,便能为其提供一些很好的生活辅助设施,给他们带来方便。
一些带有语音功能的办公设备,甚至可以帮助残疾人士在家里或在工作岗位上,开辟出一个新的生存空间。
(4)语音识别技术对各生产领域的应用
汽车工业带来的经济收入对一个国家来说是至关重要的,最新的语音识别技术已经应用到汽车领域,并且仍在不断开发和添加新的功能。
一些国内外知名的汽车制造公司,很早就预见了语音技术在汽车行业的发展前景,他们已经提出了无需操控的、在后座说话就可以驾驶的智能汽车,完全告别了手动驾驶车辆的模式。
当车在开启时,只要告诉它继续行驶和目前的位置,就能够顺利地行使到目的地。
目前,这种智能汽车已经进入了研究阶段,相信过不了多久,这个构想将很快成为现实。
(5)语音识别技术在辅助教学方面的应用
在教育领域,已经运用了多媒体语音识别应用类双向教学软件,客户包含清华大学复旦大学等在内的多个高等院校,此语音识别教学系统用来帮助学生在语言学习的过程中,引导学生正确发音,及时的纠正外语口语的发音。
该系统也可称为家庭幼儿辅导老师及中小学教育不可或缺的辅助工具。
(6)语言语音玩具
在对孩子进行启蒙教育的时候,你可以用带有语音说话功能的娃娃与孩子交谈,让孩子操作服从语音命令的玩具,在孩子们幼小的心灵就播下科学的种子,让这些玩具引导孩子们探索科技,发现科学的伟大力量。
据外国有关媒体报道,语音玩具的销售远远超出了预期水平[7]。
(7)语音识别技术在军事方面,刑事调查方面的应用
由于每个人的发音都有其独特的特点,就像人的指纹一样,具有独特性和唯一性,是非常有特点的识别标志,科学上可以运用它来判断一个特定的人。
比如,在外国科幻电影中,我们经常会看到高精密发射的核设施发射系统,它除了一般的发射检测程序外,总统声音命令也成为了核发射系统的重要密匙,在最终确认发射时,需要通过总统的特定语音命令,才可进行程序释放,核发射才进入相应倒计时阶段。
再有,在司法刑侦检测时,犯罪嫌疑人的声音也可以作为破案的重要线索,因为每个人说话的声音是不一样的,语音数据将会和DNA测试结果一起作为证据,这种方法已经得到了法律上的认可。
在国外这方面的例子数不胜数,特别在近些年来,此技术已经作为语音识别技术在应用领域的一大主题,该应用对军事和司法调查、刑事侦查具有巨大的实用价值。
1.2语音识别发展历史及现状
语音识别技术的研究历史可以追溯到上个世纪三十年代初,1947年,贝尔(Bell)实验室发明了语谱图分析仪,意味着语音识别技术研究的萌芽。
起初,语音识别是通过人工分析语谱图而进行识别的。
50年代初期,研究人员大部分致力于声学—语音学的基本概念进行探索。
1952年贝尔实验室的Davis等人首次采用识别方法是根据语音第一、二共振峰位置提取若干特征的方法研制出能识别十个英语数字的语音识别系统,实现了用模拟电路实现未知语音与参考语音之间的相关度运算[1]。
60年代初期,语音识别系统的构成基本上是用硬件实现的,通过滤波器组提取频谱特征,用计算机进行匹配、计算和判决。
计算机的使用在很大程度上加快了语音识别方法的研究。
这期间出现了语音识别的几个重要的思想,前苏联研究人员Vintsyuk提出使用动态规划来对齐两个长度不同的语音音段。
尽管动态时间弯折(DynamicTimeWrapping,DTW)概念的实质和用于连接词识别的算法雏形已经包含在Vintsyuk的研究工作中[1,2],但这十年之中并没有取得令人鼓舞的突破性进展。
70年代初,日本学者板仓(Itakura)提出了动态时间规整(DTW)技术[4],使语音识别技术研究在匹配算法方面开辟了新思路;中期的线性预测技术[5](LinearPrediction,LP)被应用于语音信号处理,然后隐马尔可夫模型法[6](HiddenMarkovModel,HMM)也获得初步的成果,该技术在语音信号处理的多个方面获得了巨大成果;70年代末,Linda、Buzo、Gray和Markel等人首次解决了矢量量化[7,11](VectorQuantization,VQ)码书生成的方法,并首先将矢量量化技术用于语音编码并且获得了成功。
这使得孤立词发音和孤立词发音的识别技术成为可行的生活实用技术。
另外,70年代的里程碑是在IBM进行了一个长期持续的、颇有成效的大词汇量连续语音识别研究的集体努力的成果。
在这期间,贝尔实验室开展了用于建立真正的非特定人语音识别系统的实验研究,提出了范围较广泛的一类复杂的聚类算法,用来确定能够表示大量人群的不同词语的所有声学变化的不同模式。
这些研究为后来非特定人模式聚类技术的研究奠定了基础,现在已经得到了广泛的应用。
继70年代的孤立词语音识别研究后,80年代主要研究的是连接词语音识别的问题,由单个词的模式串接在一起的短连接词语音进行匹配识别。
识别的方法也逐渐从最初的模板匹配方法转变到了统计模型方法,其中典型的统计方法代表是隐马尔可夫模型,由于这种方法在结构、参数和训练方法的选择上有很大的灵活性,逐渐成为了语音识别技术的主流。
HMM的理论基础在1970
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精品 毕业论文 设计 基于 虚拟仪器 语音 识别 算法 研究