文章相关引用及参考:3dsoundlabs
什么是头相关传输函数
(映维网 2018年12月31日)头相关传输函数(Head Related Transfer Function;HRTF)用于描述声波从声源到双耳的传输过程,是一种声音定位算法。当声音向我们传输而来时,HRTF将对应于我们头部的相位与频率响应。
声音传输至我们双耳的图示。
HRTF是声音向我们传输而来时的头部相位与频率响应。其变化取决于头部与身体的构造:鼻子,耳廓,嘴巴,额头和骨头密度;肩膀,双臂,双脚…。声源发出的声波经头部,耳廓,躯干等散射后到达双耳,而这一过程声波接触的任何元素都将改变声音,令声波的频率与相位有所不同。
对于这一切,我们的大脑已经相当适应,并能够理解声音的来源方向。对于这一机制,当闭上双眼时,我们在一个安静的环境中仍然可以辨别声音的来向。
总而言之,我们的双耳可充当声学定位传感器。对于头相关传输函数HRTF,它们描述了人类解剖结构对来自任何给定位置的声音所产生的影响。
1. 每个人的HRTF不尽相同
耳朵与声音的交互十分复杂
对于HRTF,我们的听觉技巧取决于我们的声学解剖构造:耳朵。在双耳的帮助下,我们行走在声场时能够听到声音。声音与我们的身体交互,而借助双耳,我们能够判断它们的来向。人类的头部与躯干构造不尽相同,这对耳朵形状同样如此。如果耳朵不同,声波散射的属性同样会有所不同。
耳廓和耳道中的开放空腔和突起影响着我们的空间声音定位。在佩戴耳机时,我们的空间声音定位机制作用将有所减少,这是因为耳机的构造与线索使我们能够通过经典耳机分辨声音的来源。
要创建精确与逼真的声音体验,关键是确定每位用户的声学解剖结构,以及它是如何影响着我们聆听声音的方式。
如同指纹一般,每个耳朵都是独特的存在。
2. HRTF的实际工作原理
HTRF的实际工作原理十分简单:通过耳机的个性化校准来提供最逼真的声音体验。所以,我们需要测量两只耳朵所听到的声音的属性,需要两个耳朵的声音对比。
HRTF能够创建沉浸感,并提供一定的深度。
正如文章开头解释的一样,要理解这一现象,你可以想象一下自己正站在一个安静的森林中,随后突然传来一阵声音,比如说猎枪的枪响。这时,你将会马上下意识地把头转向声音传来的方向。就在一瞬之间,你的大脑可以马上判断声音的位置。
人类定位声音位置的能力来源于大脑对声音特质的分析。一方面,确定声源的一个重要属性是右耳所听声音和左耳所听声音之间的差异。另一方面,声波与头部和躯干之间的相互作用有助于人脑判断声源。总之,这一切都是大脑用来确定声音来自何处的听觉线索。
耳间时间差:右耳首先听到声音。
在一个示例中,枪声从右边传来。因为声音是以声波的形式传来,它首先是到达你的右耳,然后才是左耳。另外,声音到达左耳时的效能比右耳更弱。这种音量下降是源于声波的自然消散,以及你的头部吸收和反射了一定的声音。
左右耳朵的音量差异据取决于耳间水平差(interaural level difference;ILD),其中的延迟则称作耳间时间差(interaural time difference;ITD)或双耳时间差(binaural time difference)。
耳间水平差:右耳的音量更强
大脑解释声波形状的这种差异,并用来判断声音的来源。
HRTF的实际工作原理对声波形状有着微妙但复杂的影响,而这可以帮助我们定位声音的方向,并将响应的模型变为可集成至耳机中的算法。总之,下面三个参数对HRTF的计算十分重要:
- 耳间时间差:声音到达每只耳朵的时间差
- 耳间水平差:每只耳朵的声音水平差
- 声音与个人解剖结构相互作用的光谱线索
3. HRTF的挑战
HRTF函数可以将立体音效神奇地转换为3D音效,但它们的计算成本很高。另外,每个人都有着属于自己的,独一无二地的HRTF。
头部追踪;头部形状;相应校准
要实现逼真且身临奇迹的体验,我们需要一个定制步骤,以及采用个性化数据的技术(利用本人的HRTF,而非传统的通用双耳音频)。其中一个问题是建立耳朵形状的数据库。由于这个主题仍然比较新颖,所以目前缺失一定的数据。
为了体验完全身临其境的精确音频,我们需要经常对个人的HRTF校准进行测试,并采用用于电影,游戏或音乐等软件的音频引擎进行调整。否则,用户将无法完美定位音频。