分享

听觉的机制

 新用户0118F7lQ 2021-11-20
听觉是人体最重要的感官之一。听觉可以让我们与其他人沟通,它通常是有关安全威胁的第一信息源,可以让我们获取有关周边环境的非常细节的信息。
 
1.定义声音
在物理学上,声音被定义为压力的变化。物体振动在物体所在的介质内造成分子运动时便产生声音。为了方便本节的讨论,我们只考虑空气,虽然介质也可以是液体。这种振动在空气中移动,形成振荡的传递性压力波。图1是这种波形的示意图。
                           

图片

图1:波形及其基本元素示意图
 
振动有两个主要的特性:频率和振幅。这两个特性决定着空气分子的移动方式,从而决定声音产生的方式。
频率是分子因物体振动产生运动时的移动速度,其测量单位是赫兹(Hz),即每秒的周期数。频率决定音高。频率越高,则穿过空间某个点的波纹周期数越多,从而声音越高。
振幅表示在一个声波内空气分子的最大位移。声音的振幅越大,则在空气中产生的压力变化越大,从而声音的强度也越高。最常用的声音强度测量单位是分贝(dB)。
对于纯音,比如餐叉转动发出的声音,这种声音是空气分子受压形成的均匀间距的波纹。如果分子还可以在更大的空间内移动、扩张,则会变得越来越稀薄(如图2所示)。

图片

图2:声波振动和稀薄化的功能特性示意图
不论是什么频率或振幅,声波均以相同的速度在空气中运动。在海平面、干燥空气、20°C(68°F)的条件下,声音的速度大约是1225公里/小时。因此,波长较大(音调较低)的声音比波长较小(音调较高)的声音到达耳朵的频率低,但速度是一样的。图3是这种现象的示意图。

图片

图3:波长较大的声波比波长较小的声波到达的频率(按波前)低,但速度一样
 
1.1回声与混响
在空气中传播的声波如果碰到墙壁或其他障碍物则会发生不同的反应,包括反射、折射和衍射。大多数人都有这样的经验,对着下面的山谷或在学校的空体育馆内发出很大的声音时,回声会反弹回来,当然反弹回来的声音比原始的声音要小。这种声音的反射称为回声
如果墙壁或障碍物超过17米,则反射的声音需要0.1秒或更长的时间才能返回到你的耳朵,这个时间是由声音的速度决定的。如果反射面的距离小于17米,则声音仅需不到0.1秒的时间便返回到你的耳朵。反射回来的声波与原始的声波混在一起,听起来像是一个声音,但比原来的声音长。这种现象与回声不同,称为混响。混响的最好例子是在淋浴间内唱歌。此时你听到的声音很大,这声音其实是原始声波和反射声波的混合。
需要解释的一点是,实际的混响时间可能不只0.1秒,这是因为有多次反射,而且延迟时间各不相同。
通常回声只有一个延迟时间。与反射不同,衍射指的是声波在其传播路径上穿过缺口或与障碍物发生交互作用时改变方向。这与水波和缺口或障碍物发生交互作用时的情况类似,波长越大,则衍射的数量(或混合的程度)越大,波长越小则情况相反。
第三种称为折射的效应是指声波穿过不同的介质(或相同介质但特性不同)时改变方向,并同时伴随速度和波长的改变。例如,声波从清洁的空气进入雾堤会改变特性。
1.2听觉的动态范围
物体振动会让空气分子以声波的形式运动。高频率的振动产生高频率、高音调的声波,比如哨子发出的声音。低频率的振动产生低频率、低音调的声波,比如雾角发出的声音。
总体而言,人类听觉系统的性能有不同寻常的动态范围。这个范围的下限称为听觉阈。一个健康人的耳朵可以察觉空气压力的十亿分之一(1×10-9)的振动。这相当于声波中空气分子的位移小于一个原子的直径。
这个动态范围的上限称为痛阈,超过120分贝。这个听觉范围相当于横跨12个声强级别,按频率则是从20赫兹~20000赫兹。
表1是对人类动态听觉范围的总结以及不同强度的噪声举例。

图片


之所以人在这个动态范围的低端有如此令人难以置信的敏感性,以及能感觉如此细微的压力振动,是因为外耳和中耳结构内有将声音放大的机制。在这个动态范围的上端,人类的耳朵结构通过降低或减弱传送到中耳的压力来保护知觉,但是这种反应速度比声音的速度慢。其净效应就是突然很大的声音——比如枪声或爆炸的声音仍然会伤害耳朵。
 
2.听觉通道
双耳是一对互相配合的感觉器官,能让我们进行沟通,体验周边环境产生的很大范围的刺激。这个将空气压力的振动转换成大脑可以分析和解释的电子脉冲流是整个人体内最神奇的感官过程之一,而这个过程实际上是从头部以外开始的。
 
2.1外耳
听觉是通过一个称为听觉转导的过程实现的。这个过程中,一种源(声波)被转换成另一种(传送至大脑的电子脉冲)。如图4所示,当声波到达耳朵称为心耳的部分时,这个过程的关键部分就开始了。

图片图4:人类听觉通道的主要结构

 
心耳的大部分是不能动的,由软骨和皮肤组成。心耳的那些洞、沟、脊状结构不是随机结构。这些结构实际形成了一个复杂的、非常精确的通道,将来自不同角度的声波传送至耳道内。
不论是总体形状还是具体的不规则表面结构,每个心耳都是独一无二的。除了有助于将声音输送至耳道外,心耳的表面还会反射声波并产生轻微的混响。对特定频率的声波会放大,而对其他频率的则会减弱,这样就实际上改变了频谱的形状。声音的“颜色”通常称为谱形线索,在我们定位表面声源的能力方面起着关键作用。心耳还有一项功能,就是改善对于人的行为和言语通信来说很重要的声音。
声波进入心耳后,再进入外耳道。“S”形的耳道长约2.5厘米(1英寸)、直径约0.7厘米(0.3英寸),沿长度方向变窄,为中耳结构提供保护,起着共振器的作用,并将2000~4000赫兹范围的声音放大10~15分贝。耳道的外三分之一由软骨和皮肤组成,皮肤上有毛细胞和生产耳垢的腺体。内三分之一由骨壁组成,其上覆有一层薄薄的皮肤。
 
2.2中耳
耳道的终端是一个薄的、半透明的、椭圆形的膜,其直径约为10毫米,称为耳鼓。耳鼓相对于耳道的基础角度是45°~60°,其周边的一系列小肌肉使其张紧。中耳内有一系列结构,能将进入耳道的声波转换成进入耳蜗(充满液体)的振动,而耳鼓是这个系列结构的第一个。
在一个称为听觉传导的过程中,当声波使耳鼓振动时,前后相继的三块小骨头——锤骨、砧骨和镫骨(统称为“小骨”)——使振动沿内耳移动。如图5所示,锤骨是这三块骨头的第一块,牢牢地附在耳鼓的内侧。当耳鼓振动时,锤骨便同步移动。然后,这些振动被传递到砧骨和镫骨。镫骨的基板与一块膜相连,这块膜是覆盖进入内耳的开口(称为卵圆窗)。

图片
图5:听觉传导(即把在耳内穿行的声波转换成机械振动)的示意图
这三块小骨头(人体内最小的骨头)不仅能把声波转换成机械振动,还起着杠杆的作用,即把从耳鼓进入卵圆窗的振动放大很多倍。有了这个杠杆系统,再加上耳鼓(大约80平方毫米)和卵圆窗(大约3平方毫米)之间的尺寸差异,能将振动耳鼓的分子大小的声波增加30倍。如果没有外耳和中耳小骨的放大作用,则只有0.1%的声音能进入内耳。
 
2.3内耳
内耳有三个主要的控制听觉和平衡的结构。其中的两个结构——半规管和前庭——与感知头部在三个空间平面的移动和实现平衡感有关。耳蜗是听觉通道中最重要的结构,是我们听觉的关键之所在。
耳蜗是颞骨中的一个螺旋形内腔,绕其轴线2.75圈。如图6所示,如果展开,这个内腔就像一根大约长35毫米、直径10毫米的管子。耳蜗分成三个充满液体的腔室:前庭管、鼓室管和耳蜗管(Purves等,2001)。这三个腔室由薄膜分开。前庭管和鼓室管负责传送从中耳的小骨引入的压力波,并与耳蜗顶点位置的一个开口(称为蜗孔)连接。第三个腔室,即耳蜗管,其内部有一个称为柯替氏器的非常敏感的器官。这是听觉的核心器官,其作用是将电脉冲沿听神经输送至大脑。

图片

图6:人耳的耳蜗结构在各方向的剖面图
 
2.3.1  卵圆窗和圆窗
耳鼓和中耳小骨的振动使镫骨在覆盖卵圆窗的膜上像活塞一样制动。卵圆窗位于耳蜗的前庭管的底基上。液体与空气不同,不会压缩。正因为如此,镫骨运动所产生的压力波通过另外一个开口调节。这个开口称为圆窗,位于鼓室管的底基上。如图7所示,当镫骨振动、向卵圆窗内推进时,覆盖在圆窗上的膜反相振动,向中耳(充满空气的空间)的方向鼓起。

图片

图7:卵圆窗和圆窗反相运动示意图
 
压力波在前庭管和鼓室管内形成前后运动,然后在基膜上形成上下运动,这是将耳鼓内液体的振动转换成神经信号的第一步,神经信号最后输送至大脑,感知为声音。基膜的一个重要特性,是机械性能(比如宽度和刚度)沿其长度方向持续变化。比如,基膜在其最宽点的刚度大约是其最窄点的刚度的百分之一。基膜是一种张力组织,这意味着可以将耳蜗液体内不同频率的振动直接转换成在基膜上移动的波形,基膜在特殊的位置会发生最大的位移,如图8所示。

图片

图8:耳蜗展开示意图
 
2.3.2  柯替氏器
柯替氏器(见图7-9)被描述为“蜂窝微型结构的杰作”,是整个人体内最奇妙的感觉机制之一,而且毫无疑问是整个听觉系统内最关键的结构。柯替氏器位于基膜的上方,延展至耳蜗管的整个长度方向,其表面有四排凸起的毛细胞(三排内毛细胞、一排外毛细胞)。从毛细胞伸出的纤细的毛称为静纤毛。悬在毛细胞上方的膜称为覆膜。

图片

图9:柯替氏器的剖面图
 
当压力波在鼓室管内的液体中移动时,基膜内产生的波形在毛细胞上形成压力,使静纤毛与悬在上方的覆膜接触并形成剪切运动。剪切运动使静纤毛弯曲,并触发复杂的电化学过程。这个电化学过程改变经过毛细胞膜的电压,把振动形式的能量转换成电信号。电信号经听神经传送到大脑的听觉中心。
毛细胞的反应精度非常惊人:柯替氏器内的毛细胞可以准确地探测原子大小范围的运动(即人的听阈),而且反应时间只有几十毫秒。
 
2.3.3  听神经
听神经,又称为蜗神经,其功能是把来自柯替氏器内的毛细胞的电信号输送到大脑的听觉中心进行处理。在成人体内,听神经内的神经纤维的平均数量大约是30000。这些神经纤维从耳蜗的基部引出,合在一起形成长约1英寸的神经干,其终端位置是位于脑干髓质内的蜗神经核。
 
2.4从单耳听觉到双耳听觉
因为我们的两只耳朵的功能方式完全一样。当来自每只耳朵的柯替氏器的电信号经过各自的听神经汇聚到位于脑干内的蜗神经核复合体时,听觉信息的加工便开始变为一个双耳听觉的过程。
 
3.声音线索和三维定位
人的大脑可以相当精确地确定声音源在环境中的位置。神经学家将这种能力称为定位。这个能力的核心是基于以下生理基础:我们有两只在空间上独立的耳朵,内耳的传导和感应结构非常精巧,大脑的认识中心在分析输入的声音信号方面有强大的功能。大多数有听觉能力的动物也有这个能力,但在敏锐性方面相互差异很大。比如,猫头鹰、大象、猫和老鼠都有非常好的声音定位能力。相反,马、牛和山羊在这方面的能力就非常差。
对于人类而言,精确地定位声音可以极大地提高生存所需的空间意识、丰富性和安全性。我们可以感知周边的总体声音(虽然是不同的单个声音)、通过声音了解小孩在玩耍时的位置或是在黑夜向我们靠近的敌人。通过这样的听觉能力我们可以了解周围环境非常详细的细节。
人脑用声音线索来确定声音源在环境中的空间位置,科研人员将声音线索分为三大类:双耳时间差(ITD)、双耳音强差(IID)和频谱线索。在描述这些现象时,我们会根据以下三个元素,使用一般的球面坐标系:方位角(在水平面上向左、向右或向前,正前方的方位角是零度(0°),正右方是90°,正后方是180°、高度(高出或低于水平面的角度)、距离。图10是该坐标系的示意图。

图片

图10:一般用于声音定向和定位的坐标系示意图
 
3.1 方位角线索
用于确定声音在水平面位置的最有效的线索主要有两大类。
双耳时间差(ITD)是声音到达两只耳朵的时间的差异,这个概念的示意图见图11。在同一个介质内,所有声音的运动速度都一样,不论是什么频率。当声音从正中平面的左侧或右侧到达头部,那么声音到达两只耳朵的路径距离不一样。换句话说,声音达到一只耳朵早,到达另一只耳朵晚。声音源在听者的正左方或正右方时双耳时间差最大。

图片

图11:双耳时间差示意图。
 
按声音在海平面的速度(约为340米/秒)计算,声音穿过成人头部的平均宽度需要0.6毫秒。
有必要指出的是,当声音源位于正前方、正后方、正上方或正下方(即正中平面上的任何点)时,双耳时间差为零,这意味着不能生成任何有关声音方向的信息。
双耳音强差(IID)是两只耳朵所感觉到的音强的差异,图12是这个概念的示意图。如果声音源在听者的正前方或正后方,则两只耳朵所感觉到的音强一样。而如果声音源的位置偏向一边,则双耳所感觉到的音强稍微不同。这是因为以下因素引起的:首先,声音必须穿越的距离对于两只耳朵是不一样的,距离越远,音强越低。第二,头部会干扰声波,并在处于远端的那只耳朵附近形成所谓的声影。

图片

图12:双耳音强差示意图。
 
这种现象最常见于高频率的声音,因为当声波的波长短到一定程度时,就会被头部有效阻挡。低频率(<1500赫兹)的波长比成人头部的平均宽度要大。因此,低频率的声波实际上是从头部蜿蜒而过(折射),不产生声影。
从某个角度来说,100赫兹的声波是以10英尺以下的波长在空气中穿行。1500赫兹的声波是以大约0.75英尺的波长在空气中穿行。
即使大脑能快速确定声音到达时的时间和音强差异,有些情况下仍然很难确定声音是来自你的前方还是后方。这是因为,如果声音源处于你头部的左侧或右侧的某个具体位置,其所产生的双耳时间差和双耳音强差是一样的。这就是所谓的锥形干扰区,图13是这种现象的示意图。

图片

图13:锥形干扰区示意图
 
锥形干扰区是点的集合,成锥形。这个锥形的顶点位于听者双耳的中间。声音源如果位于这个锥形区域内,则所产生的双耳时间差和双耳音强差相同。A点和B点所产生的双耳时间差和双耳音强差相同。C点和D点也是如此。
 
3.2 高度线索
如果声音源位于中间路线的任何位置,则其高度判断需要非常复杂的处理,因为声音到达的时间和强度没有变化。
心耳频谱线索,声音工程师称其为头部相关的转换功能,是指头部和肩部尺寸、形状以及外耳——心耳的曲线和管状结构不同,使声音的频率分布图发生的变化。图14是这个概念的示意图。
心耳的物理几何结构会把某些频率放大,将其他频率减弱,从而改变频谱的形状。这取决于外耳的独特形状,是一种单耳线索——如果取决于声音到达双耳轴线的不同位置,则属于双耳线索。神经科学家已经发现大脑听觉中心的神经元似乎会按频谱变化进行调整。

图片

图14:心耳结构影响来自不同方向声音的频谱响应。
 
3.3 其他线索
除了上面所述的主要声音线索,科研人员还识别了其他几种有助于总体声音定位能力的现象。
减弱,或声音强度的降低,也能帮助定位声音,因为空气中的高频率比低频率的减弱速度快。因此,声音模糊则表示声音源在远处。相反,如果高频率的清晰声音则表示声音源较近。混响水平也有助于定位,因为声音能量的混响需要时间形成,这样声音的开始部分能相对准确地指示声音源的位置,但这种指示性在刺激的过程中会变得越来越弱。
多普勒频移对于向听者逐渐靠近或逐渐远离听者的声音源特别重要。这种声音源的移动导致从高音到低音(或从低音到高音)的频谱移动,为听者提供声音源在不同时间点的位置的额外信息。
研究显示头部移动可提高声音定位的准确度,特别是当声音源位于正中平面上或锥形干扰区内时。
 
4.前庭系统
前庭系统对我们的听觉没有帮助,其作用是感知线加速和角加速以及头部的静止位置。如图15所示,其三个半圆形的管状结构相互垂直,可以感知三个空间方向的移动。

图片

图15:人类前庭系统的总体结构和关键特征示意图
 
每个管状结构内充满内淋巴,像一个环,其基部称为壶腹结构。壶腹结构内有一层对运动极其敏感的毛细胞。当头部在三个方向移动时,管状结构内的内淋巴刺激毛细胞,然后毛细胞通过神经化学过程产生电脉冲。这些电脉冲经前庭耳蜗神经被传送至脑干、小脑和脊髓中的突触。
另外一级感觉器官,椭圆囊和球囊,是小块的毛细胞结构上覆一层称为耳砂的碳酸钙晶体。这两个块状结构相互之间成直角,探测线性加速。不管头部在哪个位置,这两个块状结构之一的纤毛因耳砂的重力而弯曲。同样,纤毛弯曲触发神经化学过程、产生神经脉冲并传送至脑干。
球囊和椭圆囊的主要功能是使我们根据地心引力保持垂直方向感。如果你的头部开始倾斜,来自这两个感应结构的信号自动触发姿势调整。
在考虑这两个感应结构的功能时,有必要记住其功能是通过耦合的方式实现的,与另外一只耳朵的结构配对作用。如果这两个结构的信息有冲突,比如内淋巴严重感染时或内耳受伤后,便会导致严重的眩晕和恶心感。
同样,前庭系统通过与两只眼睛的紧密配合产生作用。实际上,前庭系统的主要功能之一是在头部移动时保持眼球固定。这样你便可以在头部左右晃动或上下运动时(比如你在走路或跑步时)保持你的视线固定在空间内的某个物体或点上。
如果双眼的视觉信号与前庭系统的信号冲突,比如在某些虚拟环境模拟中有很强的运动视觉,但没有来自耳朵的相应线索,便会导致所谓的视觉诱发的晕动症(VIMS)。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多