声频信号的时频分析.doc
- 文档编号:2491370
- 上传时间:2022-10-30
- 格式:DOC
- 页数:25
- 大小:2.25MB
声频信号的时频分析.doc
《声频信号的时频分析.doc》由会员分享,可在线阅读,更多相关《声频信号的时频分析.doc(25页珍藏版)》请在冰豆网上搜索。
声频信号的时频分析
班级011304
学号1301120308
题目声频信号的时频分析
学院通信工程学院
专业通信与信息系统
学生姓名白小慧
23
摘要
我们生活在一个信息社会里,而信息的载体就是信号。
在我们身边以及在我们身上,信号是无处不在的。
如我们随时可听到的语音信号,随时可看到的视频图像信号,伴随着我们生命始终的心电信号,脑电信号以及心音、脉搏、血压、呼吸等众多的生理信号。
语言作为人类最重要最自然的交流工具,是人类获得信息的重要来源之一.研究声频信号的特性和工业控制领域的语音识别技术,开发实用的语音识别和控制系统,对于语音识别技术的普及与应用具有十分重要的意义。
本文从声音的产生开始,分析声音的特性进而用傅里叶变换和短时傅里叶变换分析声频信号。
关键词:
语音识别,傅里叶变换,短时傅里叶变换
ABSTRACT
Asthemostimportantandnaturaltoolforhuman'scommunication,languageisoneofthemostsignificantsourcesforhumantogetinformation.Theresearchonthecharacteristicsoftheaudiosignalsandthespeechrecognitiontechnologyinthefieldofindustrialcontrolandthedevelopmentofutilitysystemofspeechrecognitionandcontrolareverysignificantandnecessaryforthepopularizationandapplicationofthespeechrecognitiontechnology.
Thispaperintroducesthegenerationofsound,someanalysesonthecharacteristicsofspeecharegiven.Inaddition,theaudiosignalsisanalyzedviatheFouriertransformandshort-timeFouriertransform.
Keywords:
speechrecognition,Fouriertransform,short-timeFouriertransform
目录
摘要 1
第一章绪论 4
第二章基本理论 5
2.1语音信号的产生 5
2.2语音信号的特性 5
2.3傅里叶变换 5
2.3.1傅里叶变换的原理 5
2.3.2傅里叶变换的计算方法 6
2.3.3傅里叶变换的本质 6
第三章短时傅立叶变换 8
3.1连续信号的短时傅立叶变换 8
3.2短时傅立叶反变换 10
3.3离散信号的短时傅立叶变换 11
第四章语音信号的时频分析仿真 13
4.1声音信号的采集 13
4.2实验结果 13
4.3实验结论 18
附录 20
第一章绪论
我们生活在一个信息社会里,而信息的载体就是信号。
在我们身边以及在我们身上,信号是无处不在的。
如我们随时可听到的语音信号,随时可看到的视频图像信号,伴随着我们生命始终的心电信号,脑电信号以及心音、脉搏、血压、呼吸等众多的生理信号。
音频检测是利用现代声学的基础理论和方法所进行的一系列检查和测量的技术应用研究。
音频检测技术中同样涉及声音在介质中的相互作用及其产生的特性、特征。
声学是音频检测技术的基础,音频检测技术是声学的理论外延及应用手段。
音频检测系统及机械、电子、计算机于一身,是声学理论、金属材料检测技术及自动控制技术的综合应用。
因此,它具有多功能检测和处理能力以及进一步实现音频检测仪器的智能化。
用语音来实现人与计算机之间的交互,主要包括三项技术,语音识别、自然语音理解和语音合成。
随着计算机处理能力的迅速提高,语音识别技术得到了飞速发展。
与计算机网络技术一样,语音识别技术的广泛应用正在日益改变着人类的生产和生活方式。
因此,研究工业控制领域的语音识别技术,开发实用的语音识别和控制系统,对于语音识别技术的,普及与应用具有十分重要的意义。
随着半导体技术特别是数字信号处理器(DigitalSignalProcessor,DSP)的飞速发展,这就为一维信号和二维图象的实时处理提供了可能。
高速器件的发展推动了新的信号处理理论的发展。
这些发展给我们的现实生活带来了许多革命性的变化,如语音信箱、自动翻译机、可视电话、会议电视、远程医疗、高清晰度电视、数字相机、移动电话、便携式个人生理参数监护仪(如心电Holter,脑电Holter等)等等。
所有这些应用领域都要涉及到信号的滤波、变换、特征提取、编码、量化、压缩等众多环节中的一个或几个。
而这些环节都离不开信号的分解。
本文将从声音的时频谱性展开分析,通过傅里叶变换描绘出声音信号的频谱图以及短时傅里叶变换描绘信号的时频图。
采集几个声音分别做了它们的傅里叶变换和短时傅里叶变换,观察并比较它们的不同。
第二章基本理论
2.1语音信号的产生
声音是一种波,他是有物体振动产生的,能被人耳听到,他的振动频率在20到20000赫兹之间。
自然界产生各种各样的声音,如雷声,树叶被风吹时发出的“飒飒”声,大海波涛汹涌的翻滚声,机械工作时发出的声音等等。
音是一种波,它具有以下几种物理特性:
1,音质。
它是一种声音区别于其他声音的基本特征。
2,音调。
就是声音的高低。
音调取决于声波的频率,频率快音调就高频率慢音调就低。
3,响度。
响度是表示声音的强弱,它是由声波震动幅度决定的。
4,音长。
它表示声音的长短,是由发音持续时间决定的。
除了物理特性外,它还具有一个重要的性质,这就是声音总是能够表达一定的意义和思想内容。
2.2语音信号的特性
语音信号从总体上看表征其特性的参数都是随时间变化的,这一点可以从语音信号的时域幅度波形上看出。
故语音信号是一个非平稳随机过程,不能用处理平稳随机信号的技术对其进行分析处理。
由于语音信号是由人的口腔内一系列肌肉运动构成的发声模型产生的,而口腔肌肉的这种运动相对于语音频率来说是非常缓慢的,故在一个短时范围内(一般认为10到30毫秒),其特性基本保持不变,可将其看作“准稳态随机过程”,这就是语音信号的“短时平稳性”。
2.3傅里叶变换
2.3.1傅里叶变换的原理
正交级数的展开是其理论基础。
将一个在时域收敛的函数展开成一系列不同频率谐波的叠加,从而达到解决周期函数问题的目的。
在此基础上进行推广,从而可以对一个非周期函数进行时频变换。
从分析的角度看,他是用简单的函数去逼近(或代替)复杂函数,从几何的角度看,它是以一族正交函数为基向量,将函数空间进行正交分解,相应的系数即为坐标。
从变幻的角度的看,他建立了周期函数与序列之间的对应关系;而从物理意义上看,他将信号分解为一些列的简谐波的复合,从而建立了频谱理论。
当然Fourier积分建立在傅氏积分基础上,一个函数除了要满足狄氏条件外,一般来说还要在积分域上绝对可积,才有古典意义下的傅氏变换。
引入衰减因子e^(-st),从而有了Laplace变换。
2.3.2傅里叶变换的计算方法
连续傅里叶变换将平方可积的函数f(t)表示成复指数函数的积分或级数形式。
这是将频率域的函数F(ω)表示为时间域的函数f(t)的积分形式。
连续傅里叶变换的逆变换(inverseFouriertransform)为
即将时间域的函数f(t)表示为频率域的函数F(ω)的积分。
一般可称函数f(t)为原函数,而称函数F(ω)为傅里叶变换的像函数,原函数和像函数构成一个傅里叶变换对(transformpair)。
2.3.3傅里叶变换的本质
傅里叶变换:
。
可以看出,傅里叶变换的本质是内积,三角函数是完备的正交函数集,不同频率的三角函数的之间的内积为0,只有频率相等的三角函数做内积时,才不为0。
下面从公式解释下傅里叶变换的意义。
因为傅里叶变换的本质是内积,所以f(t)和求内积的时候,只有f(t)中频率为的分量才会有内积的结果,其余分量的内积为0。
可以理解为f(t)在上的投影,积分值是时间从负无穷到正无穷的积分,就是把信号每个时间在的分量叠加起来,可以理解为f(t)在上的投影的叠加,叠加的结果就是频率为的分量,也就形成了频谱。
傅里叶逆变换的公式为:
下面从公式分析下傅里叶逆变换的意义。
傅里叶逆变换就是傅里叶变换的逆过程,在和求内积的时候,只有t时刻的分量内积才会有结果,其余时间分量内积结果为0,同样积分值是频率从负无穷到正无穷的积分,就是把信号在每个频率在t时刻上的分量叠加起来,叠加的结果就是f(t)在t时刻的值,这就回到了我们观察信号最初的时域。
对一个信号做傅里叶变换,然后直接做逆变换,这样做是没有意义的,在傅里叶变换和傅里叶逆变换之间有一个滤波的过程。
将不要的频率分量给滤除掉,然后再做逆变换,就得到了想要的信号。
比如信号中掺杂着噪声信号,可以通过滤波器将噪声信号的频率给去除,再做傅里叶逆变换,就得到了没有噪声的信号。
第三章短时傅立叶变换
3.1连续信号的短时傅立叶变换
由于在实际工作中所遇到的信号往往是时变的,即信号的频率在随时间变化,而传统的傅立叶变换,由于其基函数是复正弦,缺少时域定位的功能,因此傅立叶变换不适用于时变信号。
信号分析和处理的一个重要任务,一方面是要了解信号所包含的频谱信息,另一方面还希望知道不同频率所出现的时间。
Gabor提出了短时傅立叶变换(ShortTimeFourierTransform,STFT)的概念,用以测量声音信号的频率定位。
给定一信号,其STFT定义为
(3.1.1) 式中 (3.1.2)
及 ,
并且窗函数应取对称函数。
STFT的含义可解释如下:
在时域用窗函数去截(注:
将,的时间变量换成),对截下来的局部信号作傅立叶变换,即得在时刻得该段信号得傅立叶变换。
不断地移动,也即不断地移动窗函数的中心位置,即可
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 声频 信号 分析