基于MATLAB的特定人语音识别算法设计本科毕业设计.docx
- 文档编号:60710
- 上传时间:2022-10-01
- 格式:DOCX
- 页数:47
- 大小:1.12MB
基于MATLAB的特定人语音识别算法设计本科毕业设计.docx
《基于MATLAB的特定人语音识别算法设计本科毕业设计.docx》由会员分享,可在线阅读,更多相关《基于MATLAB的特定人语音识别算法设计本科毕业设计.docx(47页珍藏版)》请在冰豆网上搜索。
基于MATLAB的特定人语音识别算法设计本科毕业设计
本科毕业设计
基于MATLAB的特定人语音识别算法设计
毕业论文(设计)原创性声明
本人所呈交的毕业论文(设计)是我在导师的指导下进行的研究工作及取得的研究成果。
据我所知,除文中已经注明引用的内容外,本论文(设计)不包含其他个人已经发表或撰写过的研究成果。
对本论文(设计)的研究做出重要贡献的个人和集体,均已在文中作了明确说明并表示谢意。
作者签名:
日期:
毕业论文(设计)授权使用说明
本论文(设计)作者完全了解**学院有关保留、使用毕业论文(设计)的规定,学校有权保留论文(设计)并向相关部门送交论文(设计)的电子版和纸质版。
有权将论文(设计)用于非赢利目的的少量复制并允许论文(设计)进入学校图书馆被查阅。
学校可以公布论文(设计)的全部或部分内容。
保密的论文(设计)在解密后适用本规定。
作者签名:
指导教师签名:
日期:
日期:
注意事项
1.设计(论文)的内容包括:
1)封面(按教务处制定的标准封面格式制作)
2)原创性声明
3)中文摘要(300字左右)、关键词
4)外文摘要、关键词
5)目次页(附件不统一编入)
6)论文主体部分:
引言(或绪论)、正文、结论
7)参考文献
8)致谢
9)附录(对论文支持必要时)
2.论文字数要求:
理工类设计(论文)正文字数不少于1万字(不包括图纸、程序清单等),文科类论文正文字数不少于1.2万字。
3.附件包括:
任务书、开题报告、外文译文、译文原文(复印件)。
4.文字、图表要求:
1)文字通顺,语言流畅,书写字迹工整,打印字体及大小符合要求,无错别字,不准请他人代写
2)工程设计类题目的图纸,要求部分用尺规绘制,部分用计算机绘制,所有图纸应符合国家技术标准规范。
图表整洁,布局合理,文字注释必须使用工程字书写,不准用徒手画
3)毕业论文须用A4单面打印,论文50页以上的双面打印
4)图表应绘制于无格子的页面上
5)软件工程类课题应有程序清单,并提供电子文档
5.装订顺序
1)设计(论文)
2)附件:
按照任务书、开题报告、外文译文、译文原文(复印件)次序装订
摘要
语言是人类交换信息最方便、最快捷的一种方式,在高度发达的信息社会中,用数字化的方法进行语音的传送、存储、识别、合成和增强等是整个数字化通信网中最重要、最基本的组成部分之一。
而在随着科技技术的发展的今天,除了人与人之间的自然语言通信之外,人与机或机器与机器之间也开始使用语言。
也就是因为如此,需要涉及到语音识别技术。
为了解决机器能“听懂”人类的语言,在科技如此迅猛发展的今天,语音识别技术一直受到各国科学界的关注,其对计算机发展和社会生活的重要性也日益凸显出来。
在孤立字语音识别中,如语音密码锁,汽车控制等领域,都运用到了特定人语音识别技术,也就是DTW算法,相对于HMM算法,DTW算法具有简单操作。
在相同环境下,两者识别效果相差不大,但是HMM算法要复杂得多,主要体现在HMM算法在训练阶段需要提供大量的语音数据,而DTW算法则不需要额外的计算。
所以在特定人语音识别当中,DTW算法被广泛使用。
在本次设计中,将运用到MATLAB平台来对语音信号进行处理及识别。
相对于C语言而言,MATLAB平台更能给用户提供一个简单易懂的代码分析窗口。
而且在个性化设计中,MATLAB可以为用户提供一个人性化界面--GUI。
所以,此次设计,通过MATLAB平台建立一个GUI界面,接着对一组语音信号的输入进行预处理及端点检测,提取特征参数(MFCC),形成参考模块。
然后再对一组相同的语音信号输入进行同样的操作作为测试模块,与参考模块进行DTW算法进行匹配,输出匹配后的识别结果。
关键词:
MATLABGUI端点检测MFCCDTW
DesignofSpeechRecognitionAlgorithmBasedonSpecificMATLAB
CaiJingzuo
(CollegeofEngineering,SouthChinaAgriculturalUniversity,Guangzhou510642,China)
Abstract:
Languageisawayofhumanexchangeofinformationthemostconvenient,quick,highlydevelopedintheinformationsociety,forvoicetransmission,byusingthedigitalmethodofstorage,recognition,synthesisandenhancementisoneofthemostimportantpartsofthewhole,themostbasicdigitalcommunicationnetwork.Whilewiththedevelopmentofscienceandtechnologytoday,inadditiontonaturallanguagecommunicationbetweenpeople,betweenpeopleandmachineormachineandmachinearealsostartingtousethelanguage.Itisbecauseofthis,needtoinvolvethespeechrecognitiontechnology.Inordertosolvethemachinecan"hear"thehumanlanguage,thetechnologyissorapiddevelopmenttoday,thespeechrecognitiontechnologyhasbeenthesubjectofscientificattentionofallcountries,theimportanceofcomputerdevelopmentandsociallifeisincreasinglyprominent.
Intheisolatedwordspeechrecognition,suchasvoicepasswordlock,autocontrolfield,areappliedtothespeechrecognitiontechnology,whichisrelativetotheDTWalgorithm,HMMalgorithm,DTWalgorithmhastheadvantagesofsimpleoperation.Inthesameenvironment,boththerecognitioneffectissimilar,butHMMalgorithmismuchmorecomplex,mainlyreflectedintheHMMalgorithmneedtoprovidealargeamountofspeechdatainthetrainingphase,whiletheDTWalgorithmdoesnotneedtheextracomputation.Sointhespeaker-independentrecognition,DTWalgorithmiswidelyused.
Inthisdesign,willapplytotheMATLABplatformtocarryontheprocessingandrecognitionofspeechsignal.ComparedwiththeClanguage,MATLABplatformcanprovideuserswithasimplecodeanalysiswindow.Butinthepersonalizeddesign,MATLABcanprovideahumanuserinterface--GUI.So,thedesign,theestablishmentofaGUIinterfacethroughtheMATLABplatform,andthenasetoftheinputspeechsignalpretreatment,endpointdetection,featureparameterextraction(MFCC),theformationofthereferencemodule.Thenagroupofthesamespeechsignalinputtothesameoperationasatestmodule,matchingwithreferencetoDTWalgorithmmodule,outputmatchingrecognitionresults.
Keywords:
DTWGUIEndpointdetectionMFCCDTW
本科生毕业设计成绩评定表
1前言
语言是人类交换信息最方便、最快捷的一种方式,在高度发达的信息社会中,用数字化的方法进行语音的传送、存储、识别、合成和增强等是整个数字化通信网中最重要、最基本的组成部分之一。
随着人类步入信息社会步伐的加快,越来越多的地方需要用到语音信号处理的知识。
而MATLAB作为一个语音信号处理的平台,是一个高性能的科学计算软件,广泛应用于数学计算、算法开发、数学建模、系统仿真、数据分析处理及可视化、科学和工程绘图、应用系统开发(包括建立用户界面)等。
其语言是一种简单、高效、功能极强的高级语言,具有强大的矩阵运算能力和极高的编程效率,这一方面使得MATLAB程序可以被高度向量化,另一方面使得程序易读易写。
本设计主要围绕着MATLAB平台进行语音信号的录制及预处理,提取特征参数,建立两种模块,一组为参考模块,一组为测试模块,然后通过DTW算法进行匹配,算出匹配结果。
主要通过用户开发界面直观地呈现出来。
1.1语音识别的历史背景
早在计算机发明之前,自动语音识别的设想就已经被提上了议事日程,早期的声码器可被视作语音识别及合成的雏形。
而1920年代生产的"Radio Rex"玩具狗可能是最早的语音识别器,当这只狗的名字被呼唤的时候,它能够从底座上弹出来。
最早的基于电子计算机的语音识别系统是由AT&T贝尔实验室开发的Audrey语音识别系统,它能够识别10个英文数字。
其识别方法是跟踪语音中的共振峰。
该系统得到了98%的正确率。
到1950年代末,伦敦学院(Colledge of London)的Denes已经将语法概率加入语音识别中。
1960年代,人工神经网络被引入了语音识别。
这一时代的两大突破是线性预测编码Linear Predictive Coding (LPC),及动态时间弯折Dynamic Time Warp(DTW)技术。
语音识别技术的最重大突破是隐含马尔科夫模型Hidden Markov Model(HMM)的应用。
从Baum提出相关数学推理,经过Labiner等人的研究,卡内基梅隆大学的李开复最终实现了第一个基于隐马尔科夫模型的大词汇量语音识别系统Sphinx。
此后严格来说语音识别技术并没有脱离HMM
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 MATLAB 特定 人语 识别 算法 设计 本科 毕业设计