音频处理技术PPT课件下载推荐.ppt
- 文档编号:15106239
- 上传时间:2022-10-27
- 格式:PPT
- 页数:39
- 大小:1.85MB
音频处理技术PPT课件下载推荐.ppt
《音频处理技术PPT课件下载推荐.ppt》由会员分享,可在线阅读,更多相关《音频处理技术PPT课件下载推荐.ppt(39页珍藏版)》请在冰豆网上搜索。
物体叫声源。
声音只是声波通过固体或液体、气体声音只是声波通过固体或液体、气体传播形成的运动。
声波振动内耳的听传播形成的运动。
声波振动内耳的听小骨,这些振动被转化为微小的电子小骨,这些振动被转化为微小的电子脑波,它就是我们觉察到的声音。
脑波,它就是我们觉察到的声音。
1.2声音特性声音特性
(一)响度
(一)响度(loudness):
人主观):
人主观上感觉声音的大小(俗称音量),由上感觉声音的大小(俗称音量),由“振幅振幅”(amplitude)和人离声源的)和人离声源的距离决定,振幅越大响度越大,人和距离决定,振幅越大响度越大,人和声源的距离越小,响度越大。
(单位:
声源的距离越小,响度越大。
分贝分贝dB)
(二)音调
(二)音调(pitch):
声音的高低(高音、):
声音的高低(高音、低音),由低音),由“频率频率”(frequency)决定,)决定,频率越高音调越高(频率单位频率越高音调越高(频率单位Hz(hertz),),赫兹赫兹正常人能够听见正常人能够听见20Hz到到20000Hz的声音,而的声音,而老年人的高频声音减少到老年人的高频声音减少到10000Hz(或可以(或可以低到低到6000Hz)左右。
人们把频率高于)左右。
人们把频率高于20000Hz的声音称为超声波,低于的声音称为超声波,低于20Hz的称的称为次声波。
为次声波。
超声波(高于超声波(高于20000Hz)和正常声波()和正常声波(20Hz-20000Hz)遇到障碍物后会向原传播方向)遇到障碍物后会向原传播方向的反方向传播,而部分次声波(低于的反方向传播,而部分次声波(低于20Hz)可以穿透障碍物,俄罗斯在北冰洋)可以穿透障碍物,俄罗斯在北冰洋进行的核试验产生的次声波曾经环绕地球进行的核试验产生的次声波曾经环绕地球6圈。
超低频率次声波比其他声波(圈。
超低频率次声波比其他声波(10Hz以以上的声波)更具对人的破坏力,一部分可上的声波)更具对人的破坏力,一部分可引起人体血管破裂导致死亡,但是这类声引起人体血管破裂导致死亡,但是这类声波的产生条件极为苛刻,能让人遇上的几波的产生条件极为苛刻,能让人遇上的几率很低。
率很低。
人的发声频率在人的发声频率在100Hz(男低音)到(男低音)到10000Hz(女高音)范围内。
(女高音)范围内。
(三)音色(三)音色(musicquality是指声音的感觉是指声音的感觉特性。
不同的发声体由于材料、结构不同,特性。
不同的发声体由于材料、结构不同,发出声音的音色也不同,这样我们就可以发出声音的音色也不同,这样我们就可以通过音色的不同去分辨不同的发声体音色通过音色的不同去分辨不同的发声体音色是声音的特色,根据不同的音色,即使在是声音的特色,根据不同的音色,即使在同一音高和同一声音强度的情况下,也能同一音高和同一声音强度的情况下,也能区分出是不同乐器或人发出的。
同样的音区分出是不同乐器或人发出的。
同样的音量和音调上不同的音色就好比同样色度和量和音调上不同的音色就好比同样色度和亮度配上不同的色相的感觉一样。
)亮度配上不同的色相的感觉一样。
)2.声音信号的数字化2.1模拟音频与数字音频的区别模拟音频与数字音频的区别自然声音是连续变化的,人类最早自然声音是连续变化的,人类最早记录声音的技术是利用一些机械的、记录声音的技术是利用一些机械的、电的或磁的参数随着声波引起空气电的或磁的参数随着声波引起空气压力的连续变化而变化来模拟和记压力的连续变化而变化来模拟和记录自然的声音。
录自然的声音。
例如麦克风,当人对着麦克风讲话时,例如麦克风,当人对着麦克风讲话时,麦克风能根据它周围空气压力的不同变麦克风能根据它周围空气压力的不同变化而输出相应的连续变化的压力值,这化而输出相应的连续变化的压力值,这种变化的电压值便是一种对人类讲话声种变化的电压值便是一种对人类讲话声音的模拟,称为模拟音频。
它把声音的音的模拟,称为模拟音频。
它把声音的压力变化转变为电压信号,当输出连续压力变化转变为电压信号,当输出连续变化的电压值到录音机时,通过相应的变化的电压值到录音机时,通过相应的设备将它转换成对应的电磁信号记录在设备将它转换成对应的电磁信号记录在录音磁带上,因而便记录了声音录音磁带上,因而便记录了声音而数字化音频的获得是通过每隔一定而数字化音频的获得是通过每隔一定时间间隔测一次模拟音频的值(如电时间间隔测一次模拟音频的值(如电压)并将其数字化,这一过程称为采压)并将其数字化,这一过程称为采样,每秒钟采样的次数称为采样率。
样,每秒钟采样的次数称为采样率。
一般地。
采样率越高,记录的声音越一般地。
采样率越高,记录的声音越自然,反之,将失去声音的自然特性,自然,反之,将失去声音的自然特性,这一现象称为失真。
由模拟量转变为这一现象称为失真。
由模拟量转变为数字量的过程称为模数字量的过程称为模数转换数转换(A/D)由上可知,数字音频是离散的,而由上可知,数字音频是离散的,而模拟音频是连续的,数字音频的好模拟音频是连续的,数字音频的好坏与采样率密切相关坏与采样率密切相关2.声音信号的数字化由上节可知,自然界的声音是一种由上节可知,自然界的声音是一种模拟的音频信号,是连续量,而计模拟的音频信号,是连续量,而计算机只能处理离散的数字量,这就算机只能处理离散的数字量,这就要求必须将声音数字化要求必须将声音数字化数字化声音优点:
数字化声音优点:
一、传播时抗干扰能力强,存储时一、传播时抗干扰能力强,存储时重放性能好重放性能好二、易处理、能进行数据压缩二、易处理、能进行数据压缩三、可纠错、容易混合三、可纠错、容易混合音频信号数字化的关键步骤是采样、量化和音频信号数字化的关键步骤是采样、量化和编码编码2.2采样采样把模拟音频转成数字音频的过程把模拟音频转成数字音频的过程,就称作采就称作采样,所用到的主要设备便是模拟样,所用到的主要设备便是模拟/数字转换器数字转换器(AnalogtoDigitalConverter,即,即ADC,与,与之对应的是数之对应的是数/模转换器模转换器,即即DAC)。
采样的)。
采样的过程实际上是将通常的模拟音频信号的电信过程实际上是将通常的模拟音频信号的电信号转换成二进制码号转换成二进制码0和和1,这些,这些0和和1便构成了便构成了数字音频文件。
数字音频文件。
2.2.1采样频率采样频率每秒钟的采样样本数叫做采样频率。
每秒钟的采样样本数叫做采样频率。
采样频率越高,数字化后声波就越采样频率越高,数字化后声波就越接近于原来的波形,即声音的保真接近于原来的波形,即声音的保真度越高,但量化后声音信息量的存度越高,但量化后声音信息量的存储量也越大。
储量也越大。
采样频率与声音频率之间的关系:
根据采样定理,只有当采样频率高于根据采样定理,只有当采样频率高于声音信号最高频率的两倍时,才能把声音信号最高频率的两倍时,才能把离散模拟信号表示的声音信号唯一地离散模拟信号表示的声音信号唯一地还原成原来的声音。
还原成原来的声音。
目前在多媒体系统中捕获声音的标准目前在多媒体系统中捕获声音的标准采样频率定为采样频率定为44.1kHz、22.05kHz和和11.025kHz三种。
分别对应三种。
分别对应高保真立体声级:
高保真立体声级:
20Hz-20kHz调幅广播级:
调幅广播级:
50Hz-7kHz电话语音级:
电话语音级:
300Hz-3.4kHz2.2.2采样位数采样位数采样位数可以理解为采集卡处理声音的采样位数可以理解为采集卡处理声音的解析度解析度。
这个数值越大,解析度就越高,。
这个数值越大,解析度就越高,录制和回放的声音就越真实。
采集卡的录制和回放的声音就越真实。
采集卡的位客观地反映了数字声音信号对输入声位客观地反映了数字声音信号对输入声音信号描述的准确程度。
音信号描述的准确程度。
8位代表位代表2的的8次次方方-256,16位则代表位则代表2的的16次方次方-64K。
比较一下,一段相同的音乐信息,比较一下,一段相同的音乐信息,16位位声卡能把它分为声卡能把它分为64K个精度单位进行处理,个精度单位进行处理,而而8位声卡只能处理位声卡只能处理256个精度单位,造个精度单位,造成了较大的信号损失,最终的采样效果成了较大的信号损失,最终的采样效果自然是无法相提并论的。
自然是无法相提并论的。
2.3量化量化将采样后的音效信息数字化的过程称为量将采样后的音效信息数字化的过程称为量化化量化精度量化精度:
表示每个声音样本值采用的二:
表示每个声音样本值采用的二进制数反映了度量声音波形幅度的精度。
进制数反映了度量声音波形幅度的精度。
例如:
每个声音样本用例如:
每个声音样本用16位表示,测得位表示,测得的声音样本值为的声音样本值为065536,它的精度就是,它的精度就是1/65536。
样本位数的大小影响到声音的。
样本位数的大小影响到声音的质量,位数越多,声音的质量越高,而质量,位数越多,声音的质量越高,而存储所需的空间越多。
存储所需的空间越多。
2.4编码编码数字化的波形声音是一种使用二进数字化的波形声音是一种使用二进制表示的比特流,它遵循一定的标制表示的比特流,它遵循一定的标准或规范进行编码。
由于声音的数准或规范进行编码。
由于声音的数字化,将有大量的数据需要计算机字化,将有大量的数据需要计算机存储,如果不对这些数据进行压缩,存储,如果不对这些数据进行压缩,则很难在计算机上实现多媒体功能则很难在计算机上实现多媒体功能例如:
10分钟分钟44.1KHz,16位,双位,双声道立体声需要()声道立体声需要()MB,数据之所以可以压缩是因为数据之所以可以压缩是因为原始信原始信源数据有很大冗余度源数据有很大冗余度,人类的生理人类的生理特性特性决定只能听到决定只能听到20Hz20KHz范范围内的声音,因而可以实现高压缩围内的声音,因而可以实现高压缩比比2.5重构重构数字化声音若要重新播放还必须经数字化声音若要重新播放还必须经过过解码、解码、D/A转换和插值转换和插值解码是编码的逆过程解码是编码的逆过程D/A转换是将数字量转换为模拟量转换是将数字量转换为模拟量便于扬声器发音便于扬声器发音插值是为了弥补采样过程中引起的插值是为了弥补采样过程中引起的语音信号失真而采取的弥补措施语音信号失真而采取的弥补措施3.音频信号压缩技术常用压缩技术脉冲编码调制自适应脉冲编码调制差分脉冲编码调制自适应差分脉冲编码调制增量调制自适应增量调制3.音频信号压缩技术3.1脉冲编码调制(PCM)3.1.1均匀量化3.1.2非均匀量化3.2增量调制(DM)3.3自适应增量调制(ADM)3.4自适应脉冲编码调制(APCM)3.4差分脉冲编码调制(DPCM)3.5自适应差分脉冲调制(ADPCM)4.常用音频存储格式文件扩展名文件扩展名说明说明auSun和Next公司的声音文件格式,主要用在UNIX工作站上aiffApple计算机、SGI工作站上的声音文件格式sndApple计算机、SGI工作站上的声音文件格式wavWindow采用的波形文件存储格式wma(WindowsMediaAudio)微软公司推出的与MP3格式齐名的一种新的音频格式mp3MEPGLayerIIIrm(realmedia)RealNetworks公司的流式声音文件格式ra(realsound)RealNetworks公司的流式声音文件格式ape无损音频压缩格式flvc(FreeLosslessAudioCodec)几乎兼容所有平台
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 音频 处理 技术