最新语音识别技术与声纹鉴定原理.ppt
- 文档编号:2744448
- 上传时间:2022-11-10
- 格式:PPT
- 页数:189
- 大小:5.27MB
最新语音识别技术与声纹鉴定原理.ppt
《最新语音识别技术与声纹鉴定原理.ppt》由会员分享,可在线阅读,更多相关《最新语音识别技术与声纹鉴定原理.ppt(189页珍藏版)》请在冰豆网上搜索。
数字语音处理及MATLAB仿真张雪英编著1VoiceRecognition010203技术简介技术简介应用领域应用领域发展前景发展前景2018年年1月月数字语音处理及MATLAB仿真张雪英编著2语音识别是以语音为研究对象,通语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。
自动识别和理解人类口述的语言。
就是就是让机器听懂你说话让机器听懂你说话。
数字语音处理及MATLAB仿真张雪英编著3语音识别技术的应用包括语音拨号、语语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、音导航、室内设备控制、语音文档检索、简单的听写数据录入等。
语音识别技术简单的听写数据录入等。
语音识别技术与其他自然语言处理技术如机器翻译及与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。
复杂的应用,例如语音到语音的翻译。
数字语音处理及MATLAB仿真张雪英编著4人机交互方式图形用户界面图形用户界面GraphicUsersInterface多点触控多点触控MultiTouch数字语音处理及MATLAB仿真张雪英编著5应用领域应用领域数字语音处理及MATLAB仿真张雪英编著6SiriGooglenow车载导航车载导航智能智能PDA数字语音处理及MATLAB仿真张雪英编著7语音语音搜索搜索歌曲歌曲识别识别语音语音控制控制家电家电遥控遥控语音搜索早先的模式是我们可以通过打电话的方式查一些专项的资讯,比如天气预报或者打12315。
随着服务的延伸呢,很多的企业都尽力了自己的客户专线,实际上这个时候语音信息的服务就由企业为他的用户提供,主要是产品或者服务的资讯或者售后服务。
常见的有Apple的Siri和Google的GoogleNow。
数字语音处理及MATLAB仿真张雪英编著8语音语音搜索搜索歌曲歌曲识别识别语音语音控制控制家电家电遥控遥控生活中,时常听到很熟悉的旋律,却想不出歌曲的名字。
这个时候我们就可以直接利用语音识别功能来查找相关歌曲,常见的有微信摇一摇搜歌,以及其他音乐播放软件的搜索功能。
数字语音处理及MATLAB仿真张雪英编著9语音语音搜索搜索歌曲歌曲识别识别语音语音控制控制家电家电遥控遥控由于在汽车的行驶过程中,驾驶员的手必须放在方向盘上,因此在汽车上拨打电话,需要使用具有语音拨号功能的免提电话通信方式。
此外,对汽车的卫星导航定位系统(GPS)的操作,汽车空调、照明以及音响等设备的操作,同样也可以由语音来方便的控制。
数字语音处理及MATLAB仿真张雪英编著10语音语音搜索搜索歌曲歌曲识别识别语音语音控制控制家电家电遥控遥控用语音可以控制电视机、DVD、空调、电扇、窗帘的操作,而且一个遥控器就可以把家中的电器皆用语音控起来,这样,可以让令人头疼的各种电器的操作变得简单易行。
数字语音处理及MATLAB仿真张雪英编著11随着互联网的快速发展,以及手机等移动终端的普及应用,目前可以从多个渠道获取大量文本或语音方面的语料,这为语音识别中的语言模型和声学模型的训练提供了丰富的资源,使得构建通用大规模语言模型和声学模型成为可能。
最新进展最新进展最新进展最新进展数字语音处理及MATLAB仿真张雪英编著12目前,国外的应用一直以苹果的Siri、谷歌的GoogleNow为代表。
国内方面,科大讯飞、云知声、盛大、捷通华声、搜狗语音助手、紫冬口译、百度语音等系统都采用了最新的语音识别技术,市面上其他相关的产品也直接或间接嵌入了类似的技术。
最新进展最新进展最新进展最新进展数字语音处理及MATLAB仿真张雪英编著13发展前景语音识别系统的出现,会让人更加自由的沟通,让人在任何地方,任何时间,对任何事都能够通过语音交互的方式,方便地享受到更多的社会信息资源和现代化服务。
这必然会成为语音识别技术研究和应用的重要发展趋势。
数字语音处理及MATLAB仿真张雪英编著14发展前景但任何技术的成熟都会经历一段很长时间的发展期,所以目前依然有识别率、可靠性及成本等问题亟待人们去克服。
数字语音处理及MATLAB仿真张雪英编著15数字语音处理及MATLAB仿真张雪英编著16数字语音处理及MATLAB仿真张雪英编著17主要问题对自然语言的识别和理解。
首先必须将连续的讲话分解为词、音素等单位,其次要建立一个理解语义的规则。
语音信息量大。
语音模式不仅对不同的说话人不同,对同一说话人也是不同的,例如,一个说话人在随意说话和认真说话时的语音信息是不同的。
一个人的说话方式随着时间变化。
数字语音处理及MATLAB仿真张雪英编著18主要问题语音的模糊性。
说话者在讲话时,不同的词可能听起来是相似的。
这在英语和汉语中常见。
4.环境噪声和干扰对语音识别有严重影响,致使识别率低。
数字语音处理及MATLAB仿真张雪英编著19语音识别语音识别概述概述1HMM基本原理及在语音识别中基本原理及在语音识别中的应用的应用2数字语音处理及MATLAB仿真张雪英编著2010.1概述概述语语音音识识别别以以语语音音为为研研究究对对象象,涉涉及及到到生生理理学学、心心理理学学、语语言言学学、计计算算机机科科学学,以以及及信信号号处处理理等等诸诸多多领领域域,最最终终目目的的是是实实现现人人与与机机器器进进行行自自然然语语言通信,用语言操纵计算机。
言通信,用语言操纵计算机。
语语音音识识别别系系统统可可以以分分为为孤孤立立字字(词词)语语音音识识别别系系统、连接字语音识别系统以及连续语音识别系统。
统、连接字语音识别系统以及连续语音识别系统。
数字语音处理及MATLAB仿真张雪英编著21语语音音识识别别系系统统分分为为两两个个方方向向:
一一是是根根据据对对说说话话人人的的依依赖赖程程度度可可以以分分为为特特定定人人和和非非特特定定人人语语音音识识别别系系统统;二二是是根根据据词词汇汇量量大大小小,可可以以分分为为小小词词汇汇量量、中中等等词词汇汇量量、大大词词汇汇量量,以以及及无无限限词词汇汇量量语音识别系统。
语音识别系统。
不不同同的的语语音音识识别别系系统统,尽尽管管设设计计和和实实现现的的细细节节不不同同,但但所所采采用用的的基基本本技技术术是是相相似似的的。
一一个个典典型型的的语语音音识识别别系系统统如如下下页页图图所所示示。
主主要要包包括括预预处处理、特征提取和训练识别网络。
理、特征提取和训练识别网络。
数字语音处理及MATLAB仿真张雪英编著22输入输入预处理预处理特征提取特征提取训练识别训练识别网络网络输出输出语音识别系统组成部分图示语音识别系统组成部分图示数字语音处理及MATLAB仿真张雪英编著2310.1.1预处理预处理在在语语音音识识别别系系统统中中,语语音音信信号号预预处处理理主主要要包包括抗混叠滤波、预加重及端点检测等。
括抗混叠滤波、预加重及端点检测等。
1抗混叠滤波与预加重抗混叠滤波与预加重语语音音信信号号的的频频谱谱分分量量主主要要集集中中在在3003400Hz范范围围内内。
因因此此需需用用一一个个防防混混叠叠的的带带通通滤滤波波器器将将此此范范围围内内的的语语音音信信号号的的频频谱谱分分量量取取出出,然然后后对对语语音音信信号号进行采样,得到离散的时域语音信号。
进行采样,得到离散的时域语音信号。
数字语音处理及MATLAB仿真张雪英编著24抗混叠滤波抗混叠滤波根根据据采采样样定定理理,如如果果模模拟拟信信号号的的频频谱谱的的带带宽宽是是有有限限的的,那那么么用用等等于于或或高高于于22fm的的取取样样频频率率进进行行采采样样,所所得得到到的的信信号号能能够够完完全全唯唯一一的的代代表表原原模模拟拟信号,或者说能够由取样信号恢复出原始信号。
信号,或者说能够由取样信号恢复出原始信号。
因因此此,为为了了防防止止混混叠叠失失真真和和噪噪声声干干扰扰,必必须须在在采采样样前前用用一一个个锐锐截截止止模模拟拟低低通通滤滤波波器器对对语语音音信信号号进进行行滤滤波波。
该该滤滤波波器器称称为为反反混混叠叠滤滤波波器器或或去去伪伪滤波器。
滤波器。
数字语音处理及MATLAB仿真张雪英编著25预加重预加重语语音音从从嘴嘴唇唇辐辐射射会会有有6dB/oct的的衰衰减减,因因此此在在对对语语音音信信号号进进行行处处理理之之前前,希希望望能能按按6dB/oct的的比比例例对对信信号号加加以以提提升升(或或加加重重),以以使使得得输输出出信信号号的的电电平平相相近近似似。
可可采采用用以以下下差差分分方方程程定定义义的的数数字字滤滤波器:
波器:
(10-1)式中,系数常在式中,系数常在0.9至至1之间选取。
之间选取。
数字语音处理及MATLAB仿真张雪英编著262端点检测端点检测语语音音信信号号起起止止点点的的判判别别是是任任何何一一个个语语音音识识别别系系统统必必不不可可少少的的组组成成部部分分。
常常用用的的端端点点检检测测方方法法有有下面两种。
下面两种。
数字语音处理及MATLAB仿真张雪英编著27
(1)短时平均幅度短时平均幅度端端点点检检测测中中需需要要计计算算信信号号的的短短时时能能量量,由由于于短短时时能能量量的的计计算算涉涉及及到到平平方方运运算算,而而平平方方运运算算势势必必扩扩大大了了振振幅幅不不等等的的任任何何相相邻邻取取样样值值之之间间的的幅幅度度差差别别,这这就就给给窗窗的的宽宽度度选选择择带带来来了了困困难难,而而用用短短时时平平均均幅幅度度来来表表示示语语音音能能量量,在在一一定定程程度度上上可可以以克服这个弊端。
克服这个弊端。
数字语音处理及MATLAB仿真张雪英编著28
(2)
(2)短时平均过零率短时平均过零率当离散信号的相邻两个取样值具有不同的符当离散信号的相邻两个取样值具有不同的符号时,便出现过零现象,单位时间内过零的次数号时,便出现过零现象,单位时间内过零的次数叫做过零率。
叫做过零率。
如果离散时间信号的包络是窄带信号,那么如果离散时间信号的包络是窄带信号,那么过零率可以比较准确的反应该信号的频率。
在宽过零率可以比较准确的反应该信号的频率。
在宽带信号情况下,过零率只能粗略的反映信号的频带信号情况下,过零率只能粗略的反映信号的频谱特性。
谱特性。
数字语音处理及MATLAB仿真张雪英编著2910.1.2语音识别特征提取语音识别特征提取特特征征提提取取,也也称称为为前前端端处处理理,与与之之相相关关的的内内容则是特征间的距离度量。
容则是特征间的距离度量。
特特征征提提取取:
即即对对不不同同的的语语音音寻寻找找其其内内在在特特征征,由由此此来来判判别别出出未未知知语语音音,所所以以每每个个语语音音识识别别系系统统都都必须进行特征提取。
必须进行特征提取。
特特征征的的选选择择对对识识别别效效果果至至关关重重要要。
同同时时,还还要要考虑特征参数的计算量。
考虑特征参数的计算量。
数字语音处理及MATLAB仿真张雪英编著30孤孤立立词词语语音音识识别别系系统统的的特特征征提提取取一一般般需需要要解解决两个问题:
决两个问题:
一一个个是是从从语语音音信信号号中中提提取取(或或测测量量)有有代代表表性性的合适的特征参数的合适的特征参数(即选取有用的信号表示即选取有用的信号表示);另一个是进行适当的数据压缩。
另一个是进行适当的数据压缩。
对对于于非非特特定定人人语语音音识识别别来来讲讲,希希望望特特征征参参数数尽尽可可能能多多的的反反映映语语义义信信息息,尽尽量量减减少少说说话话人人的的个个人人信信息息(对对特特定定人人语语音音识识别别来来讲讲,则则相相反反)。
从从信信息息论论角度讲,这也是信息压缩的过程。
角度讲,这也是信息压缩的过程。
数字语音处理及MATLAB仿真张雪英编著31语音信号的特征主要有时域和频域两种。
语音信号的特征主要有时域和频域两种。
时时域域特特征征:
短短时时平平均均能能量量、短短时时平平均均过过零零率率、共振峰、基音周期等;共振峰、基音周期等;频频域域特特征征:
线线性性预预测测系系数数(LPC)、LP倒倒谱谱系系数数(LPCC)、线线谱谱
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 语音 识别 技术 声纹 鉴定 原理