新第二章 第二节 听觉系统DOCWord文档格式.docx
- 文档编号:20621098
- 上传时间:2023-01-24
- 格式:DOCX
- 页数:13
- 大小:652.26KB
新第二章 第二节 听觉系统DOCWord文档格式.docx
《新第二章 第二节 听觉系统DOCWord文档格式.docx》由会员分享,可在线阅读,更多相关《新第二章 第二节 听觉系统DOCWord文档格式.docx(13页珍藏版)》请在冰豆网上搜索。
鼓膜的振动面积约为0.55cm2,而卵形窗的面积仅为0.03cm2,前者是后者的18倍。
根据同样大小的力作用于小面积时被放大的原理,鼓膜处振动的声压到达卵形窗处将增大18倍(增加25dB)。
此外,锤骨长度比镫骨要长,根据杠杆原理,也会起到增强声压的作用。
这样从鼓膜开始传到内耳的声压增值约为30dB。
声波传播介质在中耳是空气,在内耳是淋巴液,后者对声音的阻抗大的多。
有了中耳对声压的放大,才使得人类能听到比人类能听到的那个声音能量弱一千倍的声音。
中耳的另一个重要作用是保护内耳不受强音的伤害,方法是通过连接鼓膜及连接镫骨的两块小肌肉作用使镫骨离开卵形窗。
(3)内耳
卵形窗后面是内耳,它是颅骨腔内一个小而复杂的体系。
一个主要成分是转了3圈盘成蜗牛状的管子耳蜗(蜗牛),其长度为3.5cm,靠近中耳卵形窗一侧管的断面约2mm2,而蜗孔端部面积只有0.2mm2,管内充满淋巴液。
从断面图可以看出基底板把耳蜗分成前庭阶和鼓室阶两部分。
靠近卵形窗的基底板轻而薄,并完全被绷紧;
而在接近蜗孔端的基底板肥厚且松弛。
基底板的主要机械性能是对从卵形窗传过来的激励作出反映。
由于它的组织结构特点,使得在卵形窗附近的基底板部位对高频激发敏感,而在蜗孔端的基底板部位易于对低频激发作出反映。
这样,基底板在对从中耳传来的激励作出反映的同时又在不同“地点”完成了对不同频率声波的解析。
2.听觉流程
听觉流程如图2-19所示。
基底模上的毛细胞和深入到毛细胞内部的听觉神经末梢,共同完成了由声波的机械振动到神经性脉冲的转变。
基底模上有3排外毛细胞(outerhaircell),1排内毛细胞(innerhaircell)。
听觉神经延伸出来的神经末梢与毛细胞通过突触连接。
当基底模对入射的声波作出反映而开始振动时,毛细胞也跟着振动,根据压电效应原理,耳蜗内细胞的电位会发生变化,这些电位变化被听觉神经末梢检出,并形成神经性脉冲,沿一系列神经系统通路被送到大脑皮层的听觉感知区域。
最初的刺激传输到大脑皮层的听觉区域、听觉言语区域以及其他相关区域是一个很复杂的过程。
在听觉神经系统的较低水平里,只要刺激继续着,典型的神经单位便持续地放电,而且随强度的增加,放电频率也随之增加。
在听觉系统较高水平上,例如在大脑皮层那里,反应与刺激的关系就不可能这么简单。
有些单元在声音刺激出现或持续的声音刺激停止时发生反应。
有些单元对频率或强度的一个小变化产生反应。
有关实验表明,注意的变量可能改变神经系统中对听觉刺激的反应大小。
例如以人作被试时,当人注意敲击声时,大脑对敲击声反应的某些成分就变化较大。
这就是说,改变机体觉醒状态的网状组织的活动可能影响声音刺激的皮质反应的大小。
其中的某些效应可能是抑制性的,抑制性指的是一个特定的反应比原来的水平降低了。
也曾发现“外导”的
图2-19听觉流程
抑制机构系统,其中之一是由来自大脑皮质而且延伸到耳蜗核的神经系统,当这些纤维受到电刺激时,它们抑制或阻塞了耳蜗核对听觉刺激的反应。
解剖学实验已证明某神经纤维只对某特定频率的纯音最敏感,小于该特定纯音频率的其他纯音也可以被感应,只不过要求稍高些的阈值罢了。
在大脑皮层的听觉区域里发现,一些神经元只对以其特征频率为中心的一条窄频带作出响应;
而另有一些细胞对任何频率的纯音都不作出反映。
因此,有人推测对纯音的感知依赖于脉冲是从什么样的神经纤维传给大脑的。
另一个确认的事实是,响度与每秒到达大脑听觉区域的脉冲总数有关,声音刺激越强,传向大脑的脉冲数量就越大。
听觉神经系统的刺激--抑制相互并存的机制,是我们理解人类听觉生理、心理现象的一把钥匙。
(二)声音的感知
1.听觉阈限
听阈的绝对阈限的定义是:
能使听者从寂静中分辨出纯音的最低强度。
人类的听觉系统是特别敏感的,在最敏感的频率范围之内,在阈限处鼓膜的位移甚至近似于一个氢分子直径的十分之一。
图2-20给出的是一组典型的美国人的绝对听阈曲线。
最上面的一条是触阈随频率的变化情况。
所谓触阈是指不但听到了声音,而且有了触觉。
声强越过这个强度时,人们耳中开始不舒服。
最下面一条是绝对阈限曲线,它表示的是:
在给定纯音频率值时,实验人群中有1%的人在相应的声强值下能够听到这个纯音。
该曲线表明,绝对阈限强度是随频率改变的,例如频率在1500Hz~6000Hz区间时,所需强度竟在零dB之下,即人耳能够感知该段纯音的压强比0.0002微巴还要小。
频率小于1500Hz或大于6000Hz时,要达到这条绝对听阈曲线的值,所要求的压强就大的多,例如400Hz或10000Hz的纯音所要求的声压是10dB左右。
人类听觉频率范围是20Hz~20000Hz,可以感知的最小声压是0.0002微巴,这么微小的力使鼓膜移动了大约10-9cm,近似于氢分子直径的十分之一;
在通常的会话声级上鼓膜的位移相当于100个氢分子直径;
而在触阈这种移动也只有千分之一厘米。
与触阈对应的
图2-20绝对听阈曲线。
声压约为2000微巴。
可见,人耳能够听到的声音强度的变化范围近似于天文数字,表现极高的灵敏度和适应能力,但鼓膜的位移却很微小。
2.刺激的时间累积对阈限的影响
听觉系统和其他感受器一样,也表现出时间累积效应。
图2-21表明,在短时间内一个
刺激的时间累积会使觉察阈限下降。
当然,所谓的“短时间”要有一个范围,只有在这个范围内才会有累积效果。
图2-21刺激时间的累积效果
3.听觉的差阈
所谓差阈指的是听者能够觉察出的声音刺激变动的最小值,称为差别阈限,或最小可辨差异。
在保持纯音频率不变的情况下可觉察的是最小强度的变化,在强度不变的情况下可觉察的是最小频率的变化。
差阈和听阈一样,由于是人的主观感觉,也不是常数,它取决于实验用的纯音的频率和强度。
例如1000Hz具有5dB的纯音,必须把强度增加1倍,即增加100%,才能感觉到有变化;
但对强度为100dB的1000Hz的纯音,仅仅6%的强度变化就能觉察出来了。
对于1000Hz以下的、中等声级的纯音来说,2~3Hz的变化就可以觉察到。
对于较高频率的纯音差阈大约是半个音阶的二十分之一。
如果频率保持不变,(譬如固定在1000Hz)人耳能觉察出的强度级约为280个;
如果强度保持不变,可以分辨的纯音频率约为1400个,两者组合变化的数值将达数十万个,它表明人耳具有惊人的听辨能力。
当然,这些数字都是在理想听辨条件下得到的,实际声音都是复合音或是噪声,实际听阈和纯音实验室研究结果是有所不同的。
二.声音的物理量与主观感受量
人耳所接受的语音,以及自然界存在的一切声音都是振动引起的波动现象,物理学上用周期、振幅、位相、频率以及波长等能准确地描述波动现象。
人类感知声音也是以这些客观存在的特征量为基础的,不过声音是被特定个体感知的,感受者的主观因素使得上述物理量与听音者的主观感受不完全相同。
有必要研究一下声音的物理量与主观感受量的差别。
1.响度和强度
(1)强度
描述声音强度的物理量有两个:
声压和声强。
声压指的是作用在单位面积上的力,在
听觉声学里常用的单位是达因/平方厘米,1达因/平方厘米=1微巴。
以声压标度的最小可听阈值是0.0002微巴,使人耳受到损伤的声压值是2000微巴,二者之间相差7个数量级;
声强是在单位时间内通过垂直于波传播方向的单位面积上的能量,常用单位是瓦特/平方米,或者瓦特/平方厘米,以声强标度的最小可听阈值是10-16瓦特/平方厘米,使人耳受到损伤的声强值是10-2瓦特平方厘米,二者之间相差14个数量级。
这样巨大的强度差别使用起来十分不便,因此引进一个新的量度单位:
分贝(dB),它是两个声音强度比值的对数再乘以一个常数
LP=Mlog10(P/P0)
(1)
其中,LP代表分贝值,P是某个强度值,P0是取作比较基准的强度值,M是常数。
在声压情况下,M=20,P0=0.0002微巴;
在声强情况下,M=10,P0=10-16瓦特/平方厘米。
M这样取值是由于声强正比于声压的平方。
图2-20最左边标出的是声强绝对值,最右边标出的是声压绝对值。
从图上可以看到,当声压和声强为对等值时,按照
(1)式计算出的分贝值几乎相等。
(2)响度
响度是人类听觉感受器感受到的声音强度,但二者之间不是简单的线性关系。
某个给定音的响度级定义为,这个给定音听起来与一个1000Hz纯音等响的强度(用dB计量)。
响度级单位名为方(phon),就是说响度是以dB表示的强度来度量的,比较的基准频率是1000Hz的纯音。
图2-22给出等响曲线和强度级的关系。
例如40方等响曲线上各点的响度级,都与强度为40dB的1000Hz的纯音的响度级相同,只不过随纯音频率的变化,与之对应的强度却不是40方了。
例如100Hz的纯音必须具有62dB强度才有40方的响度级,而对于30Hz的纯音则要80dB才能达到同样的响度。
出现这种现象的原因仍然是响度为主观感知量,与人类听觉器官机能及神经系统活动有关。
从等响曲线可以看到,为了保持同样响度,低频段声音必须要有较大的强度。
如果在高包真系统里对所有频率都等量衰减,那么低频音衰减得更甚,这就是为什么此时要提升低音的原因。
图2-22等响曲线与强度的关系
2.音高与频率
心理学上的音高当然和声波的频率密切相关,但它不等同于物理的频率。
听觉感受器
声的生理机能也具备识别不同频率音波的能力。
前边说过,内耳的基底膜能感受频率的差别。
距离镫骨近处,对高频刺激敏感,距离镫骨远处,对低频刺激有反应。
不同频率的刺激按“地点”发生反应,这是心理音高产生的内在因素。
图2-23主观音高与频率的关系
纯音实验表明(图2-23),在低于1000Hz的低频纯音区间,主观音高的增长速度比频率的增长来得快,例如1000Hz纯音具有1000美(mel)的音高,但实验结果指出,被确定为1000Hz纯音音高一半的纯音的频率是400Hz,而不是500Hz;
而在高频段,发一个音高为2000美的纯音时,其纯音的频率要求达到4000Hz,而不是2000Hz。
原因在于低频段声音强度大于高频段强度,为达到同样的主观音高效果,只好用频率来补偿。
复合音音高可以分两种情况来讨论。
复合音的带宽较小的话,听者倾向于选择这个频带的中心作为音高;
如果复合音包含一系列波例如含有700Hz、800Hz、900Hz和1000Hz谐音,那么感知的音高就是100Hz。
一般来说,可以用复合音波波形周期的倒数来确定其音高。
三语音的听觉感知
1.言语的功率
说话时辐射出去的功率直接影响听觉的接受质量。
辐射功率的大小,一是与个体用力
大小有关。
当其用力大喊时,平均功率达到1000微瓦,小声说话时是0.1微瓦,耳语则为0.001微瓦。
从最小到最大变化范围是60分贝;
二是与所发各音素的发音状态有关。
以英语语音为例,辅音[θ]的功率最小,0.05微瓦。
表2-4给出以辅音[θ]的功率为比较标准的英文语音相对功率。
表2-4英文语音相对功率
从表中可以看到元音的功率大于辅音,元音中开口度大的等比开口小的具有更大的功
率。
在汉语中元音功率的变化也是如此。
2.语音强度与清晰度
当说话者于受话者之间只有空气作为传播媒介时,发音强度、受话距离以及发音环境的声学条件等直接影响受话者所能接受到的声压。
随着强度增大,听觉正确识别音节的比率上升。
最近一项关于汉语单音词表和语句表的听音测试结果表明,强度达到27分贝时,测试材料的正确听觉识别率可达50%。
3.时间在语音感知中的作用
首先,时间对纯音的听阈有较大的影响。
实验发现,当纯音时长在200~300ms以下作10倍的改变时,将引起强度作10dB分贝的改变。
这意味着将200ms的纯音时长缩短到20ms,将使听觉感受性降低,原来那个强度的声音听不到了,必须把强度增加10dB,才能重新听到那个纯音;
同样,阈限强度降低10dB,那个纯音也听不到了,这时把时长增加为原来的10倍,例如由25ms增加到250ms,才可以重新听到那个纯音。
当纯音时长超过1/3秒之后,对人耳来说可以看成是无限大的,也就是说,在300ms以上,时长的增加或减少,对听阈将不起作用。
其次,时间在音源定位上的作用也很大。
如果有2个完全相同的声源同时发声,听者位于2个声源连线的中垂线上(图2-25)。
由于2声源的声音同时送入两耳,听者感觉声源的位置就在头部的中央C处;
如果将喇叭B后移34cm,此时虽然A、B同时发声,但由于B的声音比A的晚到1ms,听者感觉声音来自A喇叭。
这里说的是2个声源的声音强度一样的情况,如果这时把B喇叭的声音强度增大5dB,它比A迟到的1ms就可以被补偿回来,听者仍认为声源在C位置。
有的人把这种现象叫做双耳效应。
4.环境噪音对听觉感知的影响
这里说的噪音指的是除了人们关心的语音以外的一切声音,既包括语音也包括噪音。
图2-24给出的是不同信噪比条件下,数字、有意义单词和无意义音节的识别率。
图2-24不同S/N条件下各种语音的识别率
图2-25声源定位示意图
可以看到,对数字的识别率最高:
S/N为—6dB时,100%的识别率,—12dB条件下,仍可达75%;
对于有意义单词,S/N在—6dB时,识别率小于40%;
而S/N为—10dB的条件下,单词和无意义音节都不可能被识别。
环境噪音对日常会话的掩蔽作用与这个实验结果有些不同:
当信噪比S/N=100时,噪音不会影响言语的清晰度;
而S/N=1时,可以获得50%的单词清晰度;
当信噪比还要低时,会话言语仍然能听的懂。
造成这种现象的原因有的来自言语本身,有的来自听者方面。
滤波言语实验证明,只保留1800Hz以下的语音成分和只保留1800Hz以上的高频成分,人们对无意义音节的清晰度都达到67%,在这样清晰度条件下日常会话是完全可懂得的;
畸变言语实验证明,将言语波形做削波处理,只保留原始峰值的1%或2%大小,此时形状复杂的言语波形被改变成方形脉冲序列,出人意料的是这样严重削波的言语仍有很高的可懂度。
这些实验表明,言语波形里含有多重声学音征,它们保证了在恶劣条件下被掩蔽掉某些音征,还有别的音征存在以保证言语的可懂度。
5.鸡尾酒会效应(cocktailpartyeffect)。
大型酒会人声鼎沸,背景噪音很大。
但谈话对手们仍然谈得津津有味。
听者此时的主观努力是利用双耳取向作用,排除多数不想拾取的背景音,使得眼前话者的语音在耳内产生最大的强度;
其次,谈话对手是熟人,口音熟悉,内容也熟悉,易于相互理解。
在嘈杂的车站、机场大厅里,面向公众广播的信息很难听清楚,但对于经常旅行的人,通知的班次、通道等完全听得到,也是因为熟知其内容。
语境(context)作用。
根据言语上下文会极大地改善可懂度。
在某些案件磁带里,背景噪声很大,但侦查员完全听得懂嫌疑人的谈话内容,因为他熟知案情,他又掌握谈话方向,所以根据对方交代的一两个单词,就可以推测出下边嫌疑人要讲什么。
地区性言语和方言对可懂度的影响也很大。
特殊的发音、句式、地区土语等对非同一语言集团的人是一道屏障,而对熟知的听者确是提高可懂度的条件。
总之,在实际时空环境中,人们保有对言语很高的可懂度,不仅仅依靠语音的声学音征,还有许多别的因素在起作用。
四、掩蔽效应
在大多数情况下,言语环境存在噪声,言语被掩蔽是经常出现的。
一个声音A能感知的阈值因另一个声音B的出现而提高的现象,称为掩蔽效应。
声音B是掩蔽音,A称为被掩蔽音。
(一)纯音对纯音的掩蔽
图2-26给出利用400Hz纯音做掩蔽音时得到的实验结果。
横坐标是被掩蔽音的频率,纵坐标是听阈的变化。
实验中400Hz掩蔽音的强度有所变化,分别取用了20、40、60、80、100分贝五组强度值观察效果。
横坐标表示的是被掩蔽音的频率,范围在50—4000Hz。
纵坐标代表听阈的变化,范围在0—100dB,L=0dB的直线对应于所有纯音在没有掩蔽作用时的听阈。
实验是这样进行的:
受试者首先听一个f=300Hz的纯音,其L=0dB,然后加上f=400Hz强度为20dB的掩蔽音,这样一来,f=300Hz的纯音听不见了。
将300Hz纯音的听阈值从L=0dB提高到L1=5dB,300Hz纯音又可听到了。
如果L=0dB时的声压为P0,L1时的声压为P1,为,这时听阈的变化为
ΔL=20log(P1/P0)(dB)
这是以分贝为单位表示的掩蔽程度,也叫掩蔽量。
改变被掩蔽纯音频率值,继续同样的实验,得到图中掩蔽音强度为20分贝那条曲线。
然后,将掩蔽音400Hz强度提高到40分贝,重复上述实验。
这样就得到图中所有曲线。
实验结果揭示出以下掩蔽规律:
1.最强的掩蔽作用出现在掩蔽音频率附近,强度不同的五条掩蔽曲线的峰值都在400Hz
右边一点的地方有最大的听阈变化;
2.掩蔽音所能掩蔽的声音频率范围随着掩蔽音强度的增大而增加,例如强度为20分贝
400Hz的掩蔽音对高于800Hz音就不能发生掩蔽作用,强度提高到40分贝时,可能掩蔽的纯音频率已经接近2000Hz;
3.用一固定频率的掩蔽音进行掩蔽时,被掩蔽音的听阈变化在以掩蔽音为界的两边是不对
称的。
在被掩蔽音频率低于掩蔽音频率时,掩蔽音强度提高掩蔽范围只发生很小的变化,而在掩蔽音频率小于被掩蔽音频率之后,听阈变化速度变慢,也就是说随着二者频率差的增大,听阈变化速度逐渐降低。
也就是说,低纯音对高纯音的掩蔽作用比高纯音对低纯音的掩蔽作用要强一些。
(二)噪音对纯音的掩蔽
利用中心频率为f,带宽为Δf的白躁声来掩蔽频率f的纯音,所谓白躁声是指在整个频率范围内声功率密度相等的声信号。
首先,利用滤波技术把白躁声分成不同频带宽度噪声。
例如取Δf=750Hz,中心频率为500Hz白躁声作为掩蔽音,让它掩蔽某个纯音例如500Hz的纯音。
首先,调节掩蔽白躁声的强度,使被掩蔽音恰好听不见。
然后,围绕中心频率把白躁声的Δf由大到小对称的逐渐减小,同时保持单位频率的噪声强度(即噪声谱密度)不变。
在达到某个Δf之后,那怕再减少一点点频宽,被掩蔽音突然被听见了。
称这个Δf为临界带宽。
实验数据表明:
噪声频带存在一个临界带宽,当掩蔽噪声的带宽小于临界带宽时,能
掩蔽住纯音f的强度是随噪声带宽的增加而增加的,但当掩蔽噪声的带宽达到临界带宽后,继续增加噪声带宽就不能引起掩蔽量的增加了。
临界带宽是随中心频率而变的,被掩蔽纯音的频率(即临界带的中心频率)越高,临界带宽也越宽。
不过,二者之间的关系不是线性的。
图2-27给出了它们之间的关系曲线。
在250—650Hz之间时,临界带宽几乎为常数,约为15分贝。
低于200Hz,临界带宽有所增加。
当被掩蔽音大于600Hz时,临界带宽随频率增加而加大,从800Hz时的16分贝增加到8000Hz时的27分贝。
图2-26纯音400Hz对其他纯音的掩蔽作用
图2-27掩蔽噪声的临界带宽与被掩蔽音频率之间的关系曲线
第二章思考题
1.视网膜里主要存在哪两类细胞,它们对光反映机制有何不同?
2.视敏度的4个这边是什么?
3.什么是马赫效应?
4.音高和频率,响度与强度有什么联系与区别?
5.环境噪声对听觉感知有什么影响?
6.为保持响度不变,频率应该有什么样的变化?
7.什么是“鸡尾酒会效应”?
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 新第二章 第二节 听觉系统DOC 第二 听觉 系统 DOC