基于DSP的语音信号处理系统设计毕业设计.docx
- 文档编号:11512202
- 上传时间:2023-03-02
- 格式:DOCX
- 页数:37
- 大小:236.92KB
基于DSP的语音信号处理系统设计毕业设计.docx
《基于DSP的语音信号处理系统设计毕业设计.docx》由会员分享,可在线阅读,更多相关《基于DSP的语音信号处理系统设计毕业设计.docx(37页珍藏版)》请在冰豆网上搜索。
基于DSP的语音信号处理系统设计毕业设计
摘要
语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。
通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。
数字信号处理(DigitalSignalProcessing,简称DSP)是利用计算机或专用处理设备,以数字形式对信号进行采集、变换、滤波、估值、增强、压缩、识别等处理,以得到符合人们需要的信号形式。
矚慫润厲钐瘗睞枥庑赖。
Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换为离散的数据文件,然后利用其强大的矩阵运算能力处理数据,如数字滤波、傅里叶变换、时域和频域分析、声音回放以及各种图的呈现等,它的信号处理与分析工具箱为语音信号分析提供了十分丰富的功能函数,利用这些功能函数可以快捷而又方便地完成语音信号的处理和分析以及信号的可视化,使人机交互更加便捷。
信号处理是Matlab重要应用的领域之一。
聞創沟燴鐺險爱氇谴净。
本设计针对现在大部分语音处理软件内容繁多、操作不便等问题,采用MATLAB7.0综合运用GUI界面设计、各种函数调用等来实现语音信号的变频、傅里叶变换及滤波,程序界面简练,操作简便,具有一定的实际应用意义。
残骛楼諍锩瀨濟溆塹籟。
关键字:
Matlab,语音信号,傅里叶变换,信号处理
1绪论
1.1课题的背景与意义
通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息的形式。
语言是人类持有的功能。
声音是人类常用的工具,是相互传递信息的最主要的手段。
因此,语音信号是人们构成思想疏通和感情交流的最主要的途径。
并且,由于语言和语音与人的智力活动密切相关,与社会文化和进步紧密相连,所以它具有最大的信息容量和最高的智能水平。
现在,人类已开始进入了信息化时代,用现代手段研究语音信号,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。
酽锕极額閉镇桧猪訣锥。
让计算机能听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法。
随着计算机越来越向便携化方向发展,随着计算环境的日趋复杂化,人们越来越迫切要求摆脱键盘的束缚而代之以语音输人这样便于使用的、自然的、人性化的输人方式。
作为高科技应用领域的研究热点,语音信号采集与分析从理论的研究到产品的开发已经走过了几十个春秋并且取得了长远的进步。
它正在直接与办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理。
工业生产部门的语声控制,电话、电信系统的自动拨号、辅助控制与查询以及医疗卫生和福利事业的生活支援系统等各种实际应用领域相接轨,并且有望成为下一代操作系统和应用程序的用户界面。
可见,语音信号采集与分析的研究将是一项极具市场价值和挑战性的工作。
我们今天进行这一领域的研究与开拓就是要让语音信号处理技术走入人们的日常生活当中,并不断朝更高目标而努力。
彈贸摄尔霁毙攬砖卤庑。
语音信号采集与分析之所以能够那样长期地、深深地吸引广大科学工作者去不断地对其进行研究和探讨,除了它的实用性之外,另一个重要原因是,它始终与当时信息科学中最活跃的前沿学科保持密切的联系,并且一起发展。
语音信号采集与分析是以语音语言学和数字信号处理为基础而形成的一门涉及面很广的综合性学科,与心理、生理学、计算机科学、通信与信息科学以及模式识别和人工智能等学科都有着非常密切的关系。
对语音信号采集与分析的研究一直是数字信号处理技术发展的重要推动力量。
因为许多处理的新方法的提出,首先是在语音信号处理中获得成功,然后再推广到其他领域。
謀荞抟箧飆鐸怼类蒋薔。
1.2国内外研究现状
语音信号的采集与分析作为一个重要的研究领域,已经有很长的研究历史。
但是它的快速发展可以说是从1940年前后Dudley的声码器(vocoder)和potter等人的可见语音(VisibleSpeech)开始的。
1952年贝尔(Bell)实验室的Davis等人首次研制成功能识别十个英语数字的实验装置。
1956年Olson和Belar等人采用8个带通滤波器组提取频谱参数作为语音的特征,研制成功一台简单的语音打字机。
20世纪60年代初由于Faut和Steven的努力,奠定了语音生成理论的基础,在此基础上语音合成的研究得到了扎实的进展。
20世纪60年代中期形成的一系列数字信号处理方法和技术,如数字滤波器、快速博里叶变换(FFT)等成为语音信号数字处理的理论和技术基础。
在方法上,随着电子计算机的发展,以往的以硬件为中心的研究逐渐转化为以软件为主的处理研究。
然而,在语音识别领域内,初期有几种语音打字机的研究也很活跃,但后来已全部停了下来,这说明了当时人们对话音识别难度的认识得到了加深。
所以1969年美国贝尔研究所的Pierce感叹地说“语音识别向何处去?
”。
厦礴恳蹒骈時盡继價骚。
到了1970年,好似反驳Pierce的批评,单词识别装置开始了实用化阶段,其后实用化的进程进一步高涨,实用机的生产销售也上了轨道。
此外社会上所宣传的声纹(VoicePrint)识别,即说话人识别的研究也扎扎实实地开展起来,并很快达到了实用化的阶段。
到了1971年,以美国ARPA(AmericanResearchProjectsAgency)为主导的“语音理解系统”的研究计划也开始起步。
这个研究计划不仅在美国园内,而且对世界各国都产生了很大的影响,它促进了连续语音识别研究的兴起。
历时五年的庞大的ARPA研究计划,虽然在语音理解、语言统计模型等方面的研究积累了一些经验,取得了许多成果,但没能达到巨大投资应得的成果,在1976年停了下来,进入了深刻的反省阶段。
但是,在整个20世纪70年代还是有几项研究成果对语音信号处理技术的进步和发展产生了重大的影响。
这就是20世纪70年代初由板仓(Itakura)提出的动态时间规整(DTW)技术,使语音识别研究在匹配算法方面开辟了新思路;20世纪70年代中期线性预测技术(LPC)被用于语音信号处理,此后隐马尔可夫模型法(HNMM)也获得初步成功,该技术后来在语音信号处理的多个方面获得巨大成功;20世纪70年代未,Linda、Buzo、Gray和Markel等人首次解决了矢量量化(VQ)码书生成的方法,并首先将矢量量化技术用于语音编码获得成功。
从此矢量量化技术不仅在语音识别、语音编码和说话人识别等方面发挥了重要作用,而且很快推广到其他许多领域。
因此,20世纪80年代开始出现的语音信号处理技术产品化的热潮,与上述语音信号处理新技术的推动作用是分不开的。
茕桢广鳓鯡选块网羈泪。
20世纪80年代,由于矢量量化、隐马尔可夫模型和人工神经网络(ANN)等相继被应用于语音信号处理,并经过不断改进与完善,使得语音信号处理技术产生了突破性的进展。
其中,隐马尔可夫模型作为语音信号的一种统计模型,在语音信号处理的各个领域中获得了广泛的应用。
其理论基础是1970年前后,由Baum等人建立起来的,随后,由美国卡内基梅隆大学(CMU)的Baker和美国IBM公司的Jelinek等人将其应用到语音识别中。
由于美国贝尔实验室的Babiner等人在20世纪80年代中期,对隐马尔可夫模型深人浅出的介绍,才使世界各国从事语音信号处理的研究人员了解和熟悉,进而成为一个公认的研究热点,也是目前语音识别等的主流研究途径。
鹅娅尽損鹌惨歷茏鴛賴。
进入20世纪90年代以来,语音信号采集与分析在实用化方面取得了许多实质性的研究进展。
其中,语音识别逐渐由实验室走向实用化。
一方面,对声学语音学统计模型的研究逐渐深入,鲁棒的语音识别、基于语音段的建模方法及隐马尔可夫模型与人工神经网络的结合成为研究的热点。
另一方面,为了语音识别实用化的需要,讲者自适应、听觉模型、快速搜索识别算法以及进一步的语言模型的研究等课题倍受关注。
籟丛妈羥为贍偾蛏练淨。
1.3数字信号处理(DSP)简介
数字信号处理(DigitalSignalProcessing,简称DSP)是一门涉及许多学科而又广泛应用于许多领域的新兴学科。
20世纪60年代以来,随着计算机和信息技术的飞速发展,数字信号处理技术应运而生并得到迅速的发展。
在过去的二十多年时间里,数字信号处理已经在通信等领域得到极为广泛的应用。
預頌圣鉉儐歲龈讶骅籴。
数字信号处理是利用计算机或专用处理设备,以数字形式对信号进行采集、变换、滤波、估值、增强、压缩、识别等处理,以得到符合人们需要的信号形式。
渗釤呛俨匀谔鱉调硯錦。
数字信号处理是围绕着数字信号处理的理论、实现和应用等几个方面发展起来的。
数字信号处理在理论上的发展推动了数字信号处理应用的发展。
反过来,数字信号处理的应用又促进了数字信号处理理论的提高。
而数字信号处理的实现则是理论和应用之间的桥梁。
铙誅卧泻噦圣骋贶頂廡。
数字信号处理是以众多学科为理论基础的,它所涉及的范围极其广泛。
例如,在数学领域,微积分、概率统计、随机过程、数值分析等都是数字信号处理的基本工具,与网络理论、信号与系统、控制论、通信理论、故障诊断等也密切相关。
近来新兴的一些学科,如人工智能、模式识别、神经网络等,都与数字信号处理密不可分。
可以说,数字信号处理是把许多经典的理论体系作为自己的理论基础,同时又使自己成为一系列新兴学科的理论基础。
擁締凤袜备訊顎轮烂蔷。
1.4本文主要工作
本文简要介绍了语音信号采集与分析的发展史以及语音信号的特征、采集与分析方法,并通过PC机录制自己的一段声音,运用Matlab进行仿真分析,最后加入噪声进行滤波处理,比较滤波前后的变化。
第2章主要介绍语音信号的特点与采集,仿真主要是验证奈奎斯特定理。
第3章主要是对语音信号进行时域、频域上的分析,如短时功率谱,短时能量,短时平均过零率,语谱图分析等等。
第4章是对语音信号的综合和分析,包括语音信号的调制、叠加和滤波。
贓熱俣阃歲匱阊邺镓騷。
2语音信号的特点与采集
2.1语音信号的特点
通过对大量语音信号的观察和分析发现,语音信号主要有下面两个特点:
在频域内,语音信号的频谱分量主要集中在300~3400Hz的范围内。
利用这个特点,可以用一个防混迭的带通滤波器将此范围内的语音信号频率分量取出,然后按8kHz的采样率对语音信号进行采样,就可以得到离散的语音信号。
坛摶乡囂忏蒌鍥铃氈淚。
在时域内,语音信号具有“短时性”的特点,即在总体上,语音信号的特征是随着时间而变化的,但在一段较短的时间间隔内,语音信号保持平稳。
在浊音段表现出周期信号的特征,在清音段表现出随机噪声的特征。
蜡變黲癟報伥铉锚鈰赘。
下面是一段语音信号的时域波形图(图2-1)和频域图(图2-2),由这两个图可以看出语音信号的两个特点。
買鲷鴯譖昙膚遙闫撷凄。
图2-1语音信号时域波形图图2-2语音信号频域波形图
2.2语音信号的采集
在将语音信号进行数字化前,必须先进行防混叠预滤波,预滤波的目的有两个:
抑制输入信导各领域分量中频率超出fs/2的所有分量(fs为采样频率),以防止混叠干扰。
抑制50Hz的电源工频干扰。
这样,预滤波器必须是一个带通滤波器,设其上、下截止频率分别是fH和fL,则对于绝大多数语音编译码器,fH=3400Hz、fL=60~100Hz、采样率为fs=8kHz;而对丁语音识别而言,当用于电话用户时,指标与语音编译码器相同。
当使用要求较高或很高的场合时fH=4500Hz或8000Hz、fL=60Hz、fs=10kHz或20kHz。
綾镝鯛駕櫬鹕踪韦辚糴。
为了将原始模拟语音信号变为数字信号,必须经过采样和量化两个步骤,从而得到时间和幅度上均为离散的数字语音信号。
采样也称抽样,是信号在时间上的离散化,即按照一定时间间隔△t在模拟信号x(t)上逐点采取其瞬时值。
采样时必须要注意满足奈奎斯特定理,即采样频率fs必须以高于受测信号的最高频率两倍以上的速度进行取样,才能正确地重建波形,它是通过采样脉冲和模拟信号相乘来实现的。
下图时一段语音信号在采样频率44.1KHz情况下的频谱图。
驅踬髏彦浃绥譎饴憂锦。
图2-3原始信号时域波形图和频域波形图
由图可知,这段语音信号的频率主要集中在1KHz左右,当采样频率为44.1KHz时,由于采样频率比较大,所以采样点数就越密,所得离散信号就越逼近于原信号,频谱也没有发生混叠。
猫虿驢绘燈鮒诛髅貺庑。
图2-4抽取后的信号时域波形图和频域波形图
对上述信号进行1/80采样频率抽取,即采样频率变为将近500Hz时,由于采样频率比较小,所以采样点数就稀疏,所得离散信号就越偏离于原信号,频谱也发生了混叠。
锹籁饗迳琐筆襖鸥娅薔。
在采样的过程中应注意采样间隔的选择和信号混淆:
对模拟信号采样首先要确定采样间隔。
如何合理选择△t涉及到许多需要考虑的技术因素。
一般而言,采样频率越高,采样点数就越密,所得离散信号就越逼近于原信号。
但过高的采样频率并不可取,对固定长度(T)的信号,采集到过大的数据量(N=T/△t),给计算机增加不必要的计算工作量和存储空间;若数据量(N)限定,则采样时间过短,会导致一些数据信息被排斥在外。
采样频率过低,采样点间隔过远,则离散信号不足以反映原有信号波形特征,无法使信号复原,造成信号混淆。
根据采样定理,当采样频率大于信号的两倍带宽时,采样过程不会丢失信息,利用理想滤波器可从采样信号中不失真地重构原始信号波形。
量化是对幅值进行离散化,即将振动幅值用二进制量化电平来表示。
量化电平按级数变化,实际的振动值是连续的物理量。
具体振动值用舍入法归到靠近的量化电平上。
構氽頑黉碩饨荠龈话骛。
语音信号经过预滤波和采样后,由A/D变换器变换为二进制数字码。
这种防混叠滤波通常与模数转换器做在一个集成块内,因此目前来说,语音信号的数字化的质量还是有保证的。
市面上购买到的普通声卡在这方面做的都很好,语音声波通过话筒输入到声卡后直接获得的是经过防混叠滤波、A/D变换、量化处理的离散的数字信号。
輒峄陽檉簖疖網儂號泶。
在实际工作中,我们可以利用windows自带的录音机录制语音文件,图2-5是基于PC机的语音信号采集过程,声卡可以完成语音波形的A/D转换,获得WAVE文件,为后续的处理储备原材料。
调节录音机保存界面的“更改”选项,可以存储各种格式的WAVE文件。
尧侧閆繭絳闕绚勵蜆贅。
Wav
图2-5基于PC机的语音信号采集过程
采集到语音信号之后,需要对语音信号进行分析,如语音信号的时域分析、频谱分析、语谱图分析以及加噪滤波等处理。
识饒鎂錕缢灩筧嚌俨淒。
3语音信号的分析
3.1语音信号分析技术
语音信号分析是语音信号处理的前提和基础,只有分析出可表示语音信号本质特征的参数,才有可能利用这些参数进行高效的语音通信、语音合成和语音识别等处理。
而且,语音合成的音质好坏,语音识别率的高低,也都取决于对语音信号分析的准确性和精确性。
因此语音信号分析在语音信号处理应用中具有举足轻重的地位。
凍鈹鋨劳臘锴痫婦胫籴。
贯穿于语音分析全过程的是“短时分析技术”。
因为,语音信号从整体来看其特性及表征其本质特征的参数均是随时间而变化的,所以它是一个非平稳态过程,不能用处理平稳信号的数字信号处理技术对其进行分析处理。
但是,由于不同的语音是由人的口腔肌肉运动构成声道某种形状而产生的响应,而这种口腔肌肉运动相对于语音频率来说是非常缓慢的,所以从另一方面看,虽然语音信号具有时变特性,但是在一个短时间范围内(一般认为在10~30ms的短时间内),其特性基本保持不变即相对稳定,因而可以将其看作是一个准稳态过程,即语音信号具有短时平稳性。
所以任何语音信号的分析和处理必须建立在“短时”的基础上.即进行“短时分析”,将语音信号分为一段一段来分析其特征参数,其中每一段称为一“帧”,帧长一般取为10~30ms。
这样,对于整体的语音信号来讲,分析出的是由每一帧特征参数组成的特征参数时间序列。
恥諤銪灭萦欢煬鞏鹜錦。
根据所分析出的参数的性质的不同,可将语音信号分析分为时域分析、频域分析、倒频域分析等;时域分析方法具有简单、计算量小、物理意义明确等优点,但由于语音信号最重要的感知特性反映在功率谱中,而相位变化只起着很小的作用,所以相对于时域分析来说频域分析更为重要。
本文将简要介绍时域分析、频域分析以及语谱图分析。
鯊腎鑰诎褳鉀沩懼統庫。
3.2语音信号的时域分析
语音信号的时域分析就是分析和提取语音信号的时域参数。
进行语音分析时,最先接触到并且也是最直观的是它的时域波形。
语音信号本身就是时域信号,因而时域分析是最早使用,也是应用最广泛的一种分析方法,这种方法直接利用语音信号的时域波形。
时域分析通常用于最基本的参数分析及应用,如语音的分割、预处理、大分类等。
这种分析方法的特点是:
表示语音信号比较直观、物理意义明确。
实现起来比较简单、运算且少。
可以得到语音的一些重要的参数。
只使用示波器等通用设备,使用较为简单等。
硕癘鄴颃诌攆檸攜驤蔹。
语音信号的时域参数有短时能量、短时过零率、短时自相关函数和短时平均幅度差函数等,这是语音信号的一组最基本的短时参数,在各种语音信号数字处理技术中都要应用。
在计算这些参数时使用的一般是矩形窗或汉明窗。
阌擻輳嬪諫迁择楨秘騖。
3.2.1短时能量及短时平均幅度分析
设语音波形时域信号为x(l)、加密分帧处理后得到的第n帧语音信号为Xn(m),则Xn(m)满足下式:
氬嚕躑竄贸恳彈瀘颔澩。
其中,n=0,1T,2T,…,并且N为帧长,T为帧移长度。
设第n帧语音信号Xn(m)的短时能量用En表示,则其计算公式如下:
En是一个度量语音信号幅度值变化的函数,但它有一个缺陷,即它对高电平非常敏感(因为它计算时用的是信号的平方)。
为此可采用另一个度量语音信号幅度值变化的函数.即短时平均幅度函数Mn,它定义为:
釷鹆資贏車贖孙滅獅赘。
Mn也是一帧语音信号能量大小的表征,它与En的区别在于计算时小取样值和大取样值不会因取平方而造成较大差异,在某些应用领域也会带来一些好处。
怂阐譜鯪迳導嘯畫長凉。
短时能量和短时平均幅度函数的主要用途有:
①可以区分浊音段与清音段,因为浊音时En值比清音时大的多。
②可以用来区分声母与韵母的分界,无声与有声的分界,连字(指字之间无间隙)的分界等。
③作为一种超音段信息,用于语音识别中。
谚辞調担鈧谄动禪泻類。
3.2.2短时过零率分析
短时过零率表示一帧语音中语音信号波形穿过横轴(零电平)的次数。
过零分析是语音时域分析中最简单的一种。
对于连续语音信号,过零即意味着时域波形通过时间轴;而对于离散信号,如果相邻的取样值改变符号则称为过零。
过零率就是样本改变符号的次数。
定义语音信号Xn(m)的短时过零率Zn为:
嘰觐詿缧铴嗫偽純铪锩。
式中,sgn[]是符号函数,即:
在实际中求过零率参数时,需要十分注意的一个问题是如果输入信号中包含有50Hz的工频干扰或者A/D变换器的工作点有偏移(这等效于输入信号有直流偏移),往往会使计算的过零率参数很不准确。
为了解决前一个问题,A/D变换器前的防混叠带通滤波器的低端截频应高于50Hz,以有效地抑制电源干扰。
对于后一个问题除了可以采用低直流漂移器件外,也可以在软件上加以解决,这就是算出每一帧的直流分量并予以滤除。
熒绐譏钲鏌觶鷹緇機库。
对语音信号进行分析,发现发浊音时,尽管声道有若干个共振峰,但由于声门波引起功率谱的高频跌落,所以其话音能量约集中在3kHz以下。
而发清音时,多数能量出现在较高频率上。
高频就意味着高的平均过零率,低频意味着低的平均过零率,所以可以认为浊音时具有较低的过零率,而清音时具有较高的过零率。
当然,这种高低仅是相对而言,并没有精确的数值关系。
鶼渍螻偉阅劍鲰腎邏蘞。
利用短时平均过零率还可以从背景噪声中找出语音信号,可用于判断寂静无声段和有声段的起点和终点位置。
在孤立词的语音识别中,必须要在一连串连续的语音信号中进行适当分割,用以确定一个一个单词的语音信号,即找出每一个单词的开始和终止位置,这在语音处理中是一个基本问题。
此时,在背景噪声较小时用平均能量识别较为有效,而在背景噪声较大时用平均过零率识别较为有效。
但是研究表明,在以某些音为开始或结尾时。
如当弱摩擦音(如[f]、[h]等音素),弱爆破音(如[p]、[t]、[k]等音素)为语音的开头或结尾;以鼻音(如[n]、[m]等音素)为语音的结尾时。
只用其中一个参量来判别语音的起点和终点是有困难的,必须同时使用这两个参数。
图3-1是用Mtalab仿真一段语音信号时域波形的短时能量和短时平均过零率。
纣忧蔣氳頑莶驅藥悯骛。
图3-1语音信号的短时能量和短时平均过零率
3.3语音信号的频域分析
语音信号的频域分析就是分析语音信号的频域持征。
从广义上讲,语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等,而常用的频域分析方法有带通滤波器组法、傅里叶变换法、线性预测法等几种。
本文介绍的是语音信号的傅里叶分析法。
因为语音波是一个非平稳过程,因此适用于周期、瞬变或平稳随机信号的标准傅里叶变换不能用来直接表示语音信号,而应该用短时傅里叶变换对语音信号的频谱进行分析,相应的频谱称为“短时谱”。
颖刍莖蛺饽亿顿裊赔泷。
3.3.1利用短时博里叶变换求语音的短时谱
对第n帧语音信号Xn(m)进行傅里叶变换(离散时域傅里叶变换,DTFT),可得到短时傅里叶变换,其定义如下:
濫驂膽閉驟羥闈詔寢賻。
(3-1)
由定义可知,短时傅里叶变换实际就是窗选语音信号的标准傅里叶变换。
这里,窗w(n-m)是一个“滑动的”窗口,它随n的变化而沿着序列X(n)滑动。
由于窗口是有限长度的,满足绝对可和条件,所以这个变换是存在的。
当然窗口函数不同,博里叶变换的结果也将不同。
銚銻縵哜鳗鸿锓謎諏涼。
我们还可以将式(3—1)写成另一种形式。
设语音信号序列和窗口序列的标准傅里立叶变换均存在。
当n取固定值时,w(n-m)的傅里叶变换为:
挤貼綬电麥结鈺贖哓类。
(3-2)
根据卷积定理,有:
(3-3)
因为上式右边两个卷积项均为关于角频率w的以2π为周期的连续函数,所以也可将其写成以下的卷积积分形式:
(3-4)
即,假设x(m)的DTFT是
,且
的DTFT是
,那么
是
和
的周期卷积。
根据信号的时宽带宽积为一常数这一基本性质,可知
主瓣宽度与窗口宽度成反比,N越大,
的主瓣越窄。
由式(3-4)可知,为了使
忠实再现
的特性。
相对于
来说必须是—个冲激函数。
所以为了使
,需
;但是N值太大时,信号的分帧又失去了意义。
尤其是N大于语音的音素长度时,
已不能反映该语音音素的频谱了。
因此,应折衷选择窗的宽度N。
另外,窗的形状也对短时傅氏频谱有影响,如矩形窗,虽然频率分辨率很高(即主辩狭窄尖锐),但由于第一旁瓣的衰减很小,有较大的上下冲,采用矩形窗时求得的
与
的偏差较大,这就是Gibbs效应,所以不适合用于频谱成分很宽的语音分析中。
而汉明窗在频率范围中的分辨率较高,而且旁辩的衰减大,具有频谱泄漏少的优点。
所以在求短时频谱时一般采用具有较小上下冲的汉明窗。
赔荊紳谘侖驟辽輩袜錈。
与离散傅里叶变换和连续博里叶变换的关系一样,如令角频率w=2πk/N,则得离散的短时傅里叶变换(DFT)。
它实际上是
在频域的取样,如下所示:
塤礙籟馐决穩賽釙冊庫。
(3-5)
在语音信号数字处理中,都是采用
的离散博里叶变换(DFT)
来替代
并且可以用高效的快速傅里叶变换(FFT)算法完成由
至
的转换。
当然,这时窗长N必须是2的倍数
(L是整数)。
根据傅里叶变换的性质,实数序列的傅里叶变换的频谱具有对称性,因此,全部频谱信息包含在长度为N/2+1个
里。
另外,为了使
具有较高的频率分辨率,所取的DFT以及相应的FFT点数
应该足够多,但有时
的长度N要受到采样率和短时性的限制,例如,在通常采样率为8kHz且帧长为20ms时,N=160。
而
一般取256、512或
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 DSP 语音 信号 处理 系统 设计 毕业设计