11日前
六自由度音響表現のためのデュアルクォータニオン・アビソニックスアレイ
Eleonora Grassucci, Gioia Mancini, Christian Brignone, Aurelio Uncini, Danilo Comminiello

要約
空間音響技術は、仮想現実(VR)や拡張現実(AR)をはじめとする没入型音響体験および応用の普及に伴い、注目を集めつつある。こうした用途において、3次元音響信号は、球面調和関数で音場を分解可能な4つのキャプセルを備えたアンビソニクスマイクロホンアレイによって取得されることが一般的である。本論文では、2つの一次アンビソニクス(First Order Ambisonics: FOA)マイクロホンから得られる空間音響場を、二重クォータニオン(dual quaternion)表現によって記述する手法を提案する。この手法では、音響信号をクォータニオン代数の性質を活用して相関関係を捉える二重クォータニオンに符号化する。この拡張表現は6自由度(6DOF)を有し、音場のより正確な表現を可能にすることで、音源の高精度な局在化とより没入感のある音響体験を実現する。本手法の有効性を、音イベント局在化・検出(Sound Event Localization and Detection: SELD)ベンチマーク上で評価した。その結果、時間的畳み込みブロック(temporal convolution blocks)を組み込んだ二重クォータニオン型SELDモデル(DualQSELD-TCN)は、実数およびクォータニオン値ベースラインと比較して優れた性能を示した。これは、音場の拡張表現によるものである。本研究の完全なコードは、以下のURLから公開されている:https://github.com/ispamm/DualQSELD-TCN。