应用笔记 4632

利用相位延迟改善3D音效

By: Robert Nicoletti

摘要 : 本文解释了音频串扰的产生原因,当两个扬声器相隔距离过近时,原本应传输至一只耳朵的音频信号会进入另一只耳朵。文中阐述了如何通过相位延迟实现3D音效,使听者两耳处产生与标准视听条件相同的信号,并以MAX9775耳机放大器为例进行了说明。

类似文章于2006年8月发表在Audio DesignLine

引言

通常,只有在扬声器间隔达到一定距离时才能获得较好的立体声效果,但是,有些应用中必须将扬声器安装在一起,例如:掌上电脑、手机等。对于这类设计,需要通过引入干扰波在右声道中抵消左声道的信号,在左声道中抵消右声道的信号,从而仿真立体声音效。这种方法称作消串扰。由此产生的立体声效果优于扬声器间距达到四倍以上时的效果。

原理

为了更好地理解这一现象,我们首先考察一下人耳、大脑如何确定音源位置。人耳对频率范围在20Hz至20kHz的音频信号比较敏感,声波在传入人耳内部之前已经过耳廓处理,经过耳廓成型的信号按照传输方向改变声波共振特性,大脑根据所产生的声谱信息确认音源方向。

当声波从指定的方向传入人耳时,到达左、右耳时间的微小差异也有助于确定音源方向。这种时间延迟,即两侧声音时延(ITD),结合人耳的频响特性确定头部相关传输函数(HRTF,一种声音定位处理技术)1。HRTF函数与特定声源、听者耳朵的频响特性有关。它包含了声源到听者头部的距离、两耳的间距和声音频率等参数。

实现3D音效的根本方法是听者两耳处产生与标准视听条件相同的信号。将每个声源信号与相应声源方向的HRTF相结合,可以达到这一3D效果2

改善多媒体3D音效

大多数增强3D效果的立体声多媒体产品都未加入实现真正3D声效所需的全部方位信息。这些多媒体系统通过简单的相位延迟电路模拟HRTF,从而使感观上的声场更加宽广。因而,靠近放置的扬声器所表现出的距离也要大于实际距离。

当聆听两个扬声器发出的声音时,左声道的声音先到达左耳,后到达右耳;右声道的声音先到达右耳,后到达左耳。右耳听到较低音量的左声道信号,左耳听到较低音量的右声道信号。这种效应称为音频串扰(图1)。

图1. 音频串扰指的是右声道立体声扬声器的声音传入左耳,或者是相反方向的声音传递。
图1. 音频串扰指的是右声道立体声扬声器的声音传入左耳,或者是相反方向的声音传递。

当两个扬声器的间距逐渐缩小时,这种时延逐渐缩小,直到最后两个扬声器听起来如同一个扬声器的效果。这种串扰会使人脑“意识”到两个音源距离非常近。为了从紧凑的音源间距获得相隔较远的音源效果,必须消除耳间串扰。在每个扬声器中加入抵消另一个扬声器声音的信号,在音源前端消除听觉串扰。这种串扰的消除使听者感觉声音发自相隔较远的音源信号3

利用相位延迟消除串扰

在无线广播的天线阵列中通常通过在多发射器的每一路驱动信号中引入相位延迟来控制波束的宽度和方向。延方向排列的单天线在延x–y平面的所有方向的辐射是相同的。将几个发射天线排列起来可以使无线电波的传播被约束在x–y平面上有限的几个波瓣内。对于给定的天线间距,波瓣的宽度随着无线电波频率的增大和天线数量的增多而减小。例如,五单元天线矩阵发射零相位延迟的信号(即完全相同的信号)产生的典型辐射图形如图2所示。

图2. 五单元天线矩阵(单元间相差为零)产生的辐射图,天线位于原点,沿x轴以半波长为间距。
图2. 五单元天线矩阵(单元间相差为零)产生的辐射图,天线位于原点,沿x轴以半波长为间距。

除了改变波瓣的宽度,通过对连续单个天线的信号设定固定的相位延迟α (图3),还可以实现主波瓣在x–y平面内的旋转。天线阵列的辐射图正比于天线阵列系数F(u):
式1.
其中,N是阵列中天线的数量,为辐射波数,d为天线间距,Ψ为天线与x轴正半轴的夹角4

图3. 五单元天线矩阵产生的辐射图,单元间相差分别为pi/2 (a)和2pi/3 (b)。
图3. 五单元天线矩阵产生的辐射图,单元间相差分别为π/2 (a)和2π/3 (b)。

声波中的应用

因为声波也遵从叠加原理,所以可以应用这一原理组建“扬声器阵列”,使声音从一个声道传入左耳,从另一个声道传入右耳(图4)。

图4. 在这个立体声音频扬声器阵列框图中包括两个缓冲放大器,每个放大器增加a°的相位延时。
图4. 在这个立体声音频扬声器阵列框图中包括两个缓冲放大器,每个放大器增加α°的相位延时。

由于HRTF指标与指定音源和听众的位置有关,推导HRTF时必须规定假设条件,消除特定应用中的声音串扰。

假设扬声器置于手持设备,扬声器间距d不会超过7cm,并假设头的宽度是20cm,耳朵和手持设备的距离为50cm。则夹角ΨL和ΨR (x正半轴与听众左、右耳之间的夹角)为78.5°和101.5°。当左声道没有信号,而右声道有信号时,最合适的相差应当使右耳附近的声强最大(图5)。

图5. 图4架构中信号仅作用在右声道,a = 90°、f = 6.1kHz、d = 7cm时,在右耳、左耳产生的声音幅度的比值最大。
图5. 图4架构中信号仅作用在右声道,α = 90°、f = 6.1kHz、d = 7cm时,在右耳、左耳产生的声音幅度的比值最大。

由式1可以看出,对于两个单元天线阵列的F(u),当u = 0时得到最大值;当u = π时得到最小值。当右声道信号不为零时,可得:
式2.
所以,最佳相差为-90°。将带入方程:
式3.
6.1kHz接近人耳听觉的最敏感频率,当信号偏离这一最佳频率时,该固定相差产生的音效质量会降低,但是该技术仍好于其它的相位延迟方法,比如:相位延迟与频率成线性关系的方法。

电路设计

产生固定相位延迟(即,相差)的网络在无线通信中有广泛的应用,早在二十世纪五十年代就已经出现基于此方法的设计。基本的拓扑结构包括两个级联的一阶全通电路(图6),它们实现基于共模输入的非恒定相移。在特定的频率范围内,此系统表现出近似恒定的相移。

图6. 一阶全通电路
图6. 一阶全通电路

无源方案可以实现该电路,但是更通用的方法是有源电路(图7)。对于线性信号(相应的输入通道),电路呈现为一个ft = 10kHz的相移滤波器,对于积分信号(另一路输入),电路呈现为一个ft = 1kHz的相移滤波器。目的是使线性输入信号和积分信号之间在音频带宽1kHz至10kHz范围内呈现90°相移。

图7. 在级联的一阶有源全通电路中,这是最常用的一种电路。
图7. 在级联的一阶有源全通电路中,这是最常用的一种电路。

图8中级联的一阶全通电路在1kHz至10kHz的范围内,L和Q两个输出的相移近似90°。因为大部分便携设备的扬声器太小,无法支持全部的声谱,所以1kHz至10kHz的输出范围是可行的。通常便携设备的扬声器在300Hz以下只能提供很小的响应。

图8. 图7电路的频率响应,在1kHz至10kHz整个频率范围内提供近似的90°相移。
图8. 图7电路的频率响应,在1kHz至10kHz整个频率范围内提供近似的90°相移。

为了进一步增强3D效果,可以增加更多的级联结构,把它们适当排列,从而在更宽的频率范围内实现90°相移。两级级联结构可以在电路复杂性、功耗和性能之间达到较好的折衷。Maxim的MAX9775音频IC结合了相位延迟电路和音频功放,采用单芯片可实现更宽的播放音域。



参考文献
Bedrosian, S.D., "Normalized design of 90° phase-shift networks., IRE Transactions on Circuit Theory, (June 1960), pp. 128–136.

Albersheim, W.J., Shirley, F.R., "Computation methods for broad-band 90° phase-difference methods," IEEE Transactions on Circuit Theory, 16, (2) (May 1969), pp. 189–196.


尾注
1Sibbald, Alastair, An Introduction to Sound and Hearing, Sensaura LTD., 2000.

2Casey, Michael, Gardener, William G., Basu, Sumit, Vision Steered Beam-Forming and Transaural Rendering for the Artificial Life Interactive Video Environment, MIT Media Laboratory, Cambridge MA, 1995.

3Gardner, William G, 3D Audio Acoustic Environment Modeling, Wave Art Inc., 99 Massachusetts Ave., Suite 7, Arlington, MA. March 15, 1999.

4Kong, J. A, Electromagnetic Wave Theory, Second Ed., John Wiley & Sons, Inc., New York, 1990. pp. 243–269.