アプリケーションノート 4632

位相遅延による3Dオーディオの強化

筆者: Robert Nicoletti

要約: このアプリケーションノートでは、2つのスピーカが近接して配置されているために、一方の耳に届くべき音が反対の耳にも届く場合に生じるトランスオーラルクロストークについて説明します。このアプリケーションノートでは、位相遅延を使用することによって3D効果を作り出し、通常のリスニング状況で発生するものと同様の音響信号を2つの耳の位置で発生させる方法を示します。デバイスの例としてヘッドフォンアンプMAX9775を取り上げます。

同様の記事が2006年8月に「Audio DesignLine」に掲載されました。

はじめに

ステレオ音声は、通常はスピーカ間に相当量の間隔が設けられている場合にのみ実現されます。しかし、ハンドヘルドコンピュータや携帯電話など、多くのアプリケーションではスピーカ同士を近接させて実装する必要があります。それらを設計する場合、波形の干渉を利用してリスナーの右耳に届く左チャネル音声と左耳に届く右チャネル音声を相殺することによって、ステレオをシミュレートすることができます。トランスオーラルクロストークキャンセルと呼ばれるこの手法によって、実際の間隔の少なくとも4倍の聴感上の間隔をスピーカ間に作り出すことができます。

理論

この現象をより深く理解するために、耳と脳が情報を処理して音源の位置を判断する仕組みを考察します。人間の耳は、約20Hz~20kHzの範囲のいわゆる「可聴」音波を感じ取ることができます。耳に到達した音波は、外耳で整形されてから内部の鼓膜に届きます。このリシェーピングによって、耳への進入方向に応じて音波の共鳴特性が変化します。結果のスペクトルから、脳は音波が発生した方向を判定することができます。

特定の方向から音波がリスナーの頭部に向かって伝播するとき、左右の耳への到着時間のごくわずかな差も、リスナーが音源の方向を判断する上で役立ちます。この時間遅延はITD (interaural time delay、両耳間時間差)と呼ばれ、耳のスペクトル特性との相乗作用によって、個々の耳についてのHRTF (head-related transfer function、頭部伝達関数)¹が決定されます。HRTFは、特定の音源とリスナーの耳との関係を示す数学的伝達関数であり、リスナーの頭部までの距離、左右の耳の間隔、および音声周波数という形で音源の位置を示します。

3D効果をシミュレートするための基本的な概念は、通常のリスニング状況で信号が発生する場合と同様の音響信号を、2つの耳の位置で発生させるというものです。この3D効果は、左右の各ソース信号と、音源の方向に応じた1組のHRTFとを組み合わせることによって実現されます²。

マルチメディア3Dエンハンスメント

3Dエンハンスメントを備えたステレオマルチメディア製品の大部分は、完全な3次元サウンドを生成するために必要なすべての方向情報に対応していません。ほとんどの場合、それらのマルチメディアシステムは聴覚上の音場に広がり効果をもたらす単純な位相遅延回路で構成されたHRTFを採用しています。それによって、近接して配置されたスピーカ間に実際よりも大きな間隔があるように感じさせます。

2つのスピーカ音源からの音を聞く場合、左チャネルの信号は右耳よりも先に左耳に到達し、右チャネルの信号は左耳よりも先に右耳に到達します。しかし、右耳にも若干の左チャネルの音が聞こえ、左耳には右チャネルの音が聞こえます。この作用は、トランスオーラル音響クロストークと呼ばれます(図1)。

図1. トランスオーラルアコースティッククロストークは、右側のスピーカからの音の一部が左耳に到達し、逆に左スピーカの音が右耳に到達するというものです。
図1. トランスオーラルアコースティッククロストークは、右側のスピーカからの音の一部が左耳に到達し、逆に左スピーカの音が右耳に到達するというものです。

スピーカ同士を接近させるに連れてこれらの時間遅延は減少して行き、最後には2つのスピーカからの音が単一のスピーカから聞こえてくるように感じられます。結果として生じるクロストークが、音源の間隔が狭いことを我々の脳に「教える」働きをします。互いに近接した2つの音源の間でより大きな間隔をシミュレートするためには、このクロストークを排除する必要があります。それぞれのスピーカから反対側への相殺用の信号を追加することによって、音源の正面にいるリスナーにとってのクロストークを相殺することができます。繰り返しますが、このアコースティックキャンセルによって、スピーカの間隔が実際より広いような印象がリスナーに与えられます³。

位相遅延によるクロストークの相殺

複数の放射器を駆動する個々の信号に位相遅延を導入する手法は、無線アンテナアレイのビーム幅と指向性を制御するために広く使用されています。方向に伸びた単一のアンテナがx-y平面上のすべての方向に均一に放射を行うのに対して、複数の送信アンテナを一列に並べることによって、その放射の広がりをx-y平面に沿ったいくつかの明確なローブに限定することができます。アンテナの間隔が一定の場合、ローブの幅はアンテナの数および無線波の周波数に伴って減少します。たとえば、素子間の位相差がゼロの(すなわちすべてのアンテナが同一の信号を放射する) 5素子のアレイは、図2に示す標準的な放射パターンを生成します。

図2. 素子間の位相差がゼロの5素子のアンテナアレイは、この放射パターンを生成します。アンテナは原点に位置しており、x軸に沿って半波長の間隔で配置されています。
図2. 素子間の位相差がゼロの5素子のアンテナアレイは、この放射パターンを生成します。アンテナは原点に位置しており、x軸に沿って半波長の間隔で配置されています。

ローブの幅を変える以外にも、アレイ中で連続する各素子への信号を一定の位相角αずつ遅延させることによって、x-y平面上でメインローブを回転させることができます(図3)。この場合、アレイの放射パターンはアレイ係数F(u)に比例します。
Equation 1.
ここで、Nはアレイに含まれるアンテナの数、は放射波の数、dはアンテナの間隔、Ψは正のx軸との角度です4

図3. これらの放射パターンは、素子間の位相差がpi/2 (a)、および2pi/3 (b)である5素子のアンテナアレイによって生成されるものです。
図3. これらの放射パターンは、素子間の位相差がπ/2 (a)、および2π/3 (b)である5素子のアンテナアレイによって生成されるものです。

音への応用

音波も重ね合わせの原理に従うため、一方のステレオチャネルからの音を片方の耳へ、もう一方のチャネルからの音を反対側の耳へ指向させるスピーカアレイの作成に、これらの結果を適用することができます(図4)。

図4. このステレオサウンド用オーディオスピーカアレイのブロックダイアグラム図では、2つのバッファアンプがそれぞれa°の位相遅延を付加します。
図4. このステレオサウンド用オーディオスピーカアレイのブロックダイアグラム図では、2つのバッファアンプがそれぞれα°の位相遅延を付加します。

個々のHRTFは特定の音源とリスナーの関係に固有であるため、具体的なアプリケーションについてトランスオーラルアコースティッククロストークを相殺するHRTFを実現する際には、いくつかの仮定を行う必要があります。

スピーカがハンドヘルドデバイスに実装されると仮定した場合、パラメータdは7cm以下になるはずです。次に、頭の幅を20cm、両耳からデバイスまでの距離を50cmと仮定した場合、角ΨLおよびΨR (それぞれ、正のx軸から測ったリスナーの左耳と右耳の角度)は78.5°と101.5°になります。左は信号なし、右は非ゼロの信号という条件では、右耳の近傍での音量が最大になるのが最適な位相差です(図5)。

図5. 図4で右チャネルにのみ信号を印加した場合、a = 90°、f = 6.1kHz、d = 7cmのときに右耳と左耳の音量比が最大になります。
図5. 図4で右チャネルにのみ信号を印加した場合、α = 90°、f = 6.1kHz、d = 7cmのときに右耳と左耳の音量比が最大になります。

再び式1を見ると、2素子のアレイのF(u)は、u = 0のとき最大、u = πのとき最小になります。したがって、右チャネルが非ゼロの信号である場合は次のようになります。
Equation 2.
このように、最適な位相差は-90°になります。という関係を使用して、以下を得ることができます。
Equation 3.
6.1kHzは人間の耳の周波数応答における感度のピークに近いため、上記の結果は好都合です。信号がこの最適な周波数から離れるほど、一定の位相差によって性能の劣化が生じます。にも関わらず、定位相方式は、それ以外の位相と周波数の関係(リニアな位相対周波数など)を備えた方式よりも優れていることが明らかになっています。

回路設計

一定の位相シフト(すなわち位相差)を生成する回路は無線エレクトロニクスで幅広く利用されており、それらを設計するための手法は1950年代から存在してきました。基本的なトポロジーは、共通の入力に対して非定値の位相シフトを生成する、カスケードされた2つの1次オールパス段で構成されます(図6)。しかし、所定の周波数範囲については相互にほぼ一定の位相シフトを維持します。

図6. 基本的な1次オールパス回路
図6. 基本的な1次オールパス回路

パッシブな実装も利用可能ですが、1次セクションとして最も広く使用されているのはアクティブ回路です(図7)。この回路は、リニアな信号(適切な入力チャネル)に対してはft = 10kHz、直角位相の信号(もう一方の入力)に対してはftが1kHzの位相シフトフィルタの働きをします。目的は、1kHz~10kHzのオーディオ帯域にわたってリニアな信号と直角位相の信号の間に90°の位相シフトを生成することです。

図7. カスケード接続、1次、アクティブオールパス回路の中で、この回路が最も一般的に使用されています。
図7. カスケード接続、1次、アクティブオールパス回路の中で、この回路が最も一般的に使用されています。

図8に示すカスケード接続、1次、オールパス回路は、1kHz~10kHzの周波数範囲にわたってL出力とQ出力の間にほぼ90°の位相差を実現します。ポータブルオーディオデバイスが備えるスピーカの大部分はフルスペクトルのオーディオをサポートするには小さすぎるため、1kHz~10kHzという範囲で十分です。一般的に、それらのスピーカは300Hz以下ではほとんど応答を示しません。

図8. この応答は図7の回路のものであり、望ましい90°の位相差に対して1kHz~10kHzの範囲にわたる良好な近似を示しています。
図8. この応答は図7の回路のものであり、望ましい90°の位相差に対して1kHz~10kHzの範囲にわたる良好な近似を示しています。

3D効果を向上させるために、さらに多くの段をカスケード接続で追加して、それらを適切に調整することで、回路が90°の位相シフトを維持する周波数範囲を拡大することが可能です。しかし、ここで示した2段のカスケードは、回路の複雑性、消費電力、および性能の間のトレードオフとして優れたものです。MAX9775などのオーディオICには位相遅延回路とオーディオアンプが内蔵されており、実際よりも広い聴感上の音場をシングルチップでシミュレートすることが可能です。



参考文献
S. D. Bedrosian著 「Normalized design of 90° phase-shift networks」、IRE Transactions on Circuit Theory、1960年6月、pp. 128–136

W. J. Albersheim、F. R. Shirley共著 「Computation methods for broad-band 90° phase-difference methods」、IEEE Transactions on Circuit Theory、16、(2)、1969年5月、pp. 189–196


後注
1Alastair Sibbald著 「An Introduction to Sound and Hearing」、Sensaura LTD.、2000年

2Michael Casey、William G. Gardener、Sumit Basu共著 「Vision Steered Beam-Forming and Transaural Rendering for the Artificial Life Interactive Video Environment」、MITメディアラボ、マサチューセッツ州ケンブリッジ、1995年

3William G. Gardner著 「3D Audio Acoustic Environment Modeling」、Wave Art Inc.、マサチューセッツ州アーリントン、99 Massachusetts Ave.、Suite 7、1999年3月15日

4J. A. Kong著 「Electromagnetic Wave Theory, Second Ed.」、John Wiley & Sons, Inc.、ニューヨーク州、1990年発行、pp. 243–269