Dual Quaternion Ambisonics Array für die sechsgradige Freiheits-Akustikdarstellung

Raumakustische Verfahren gewinnen aufgrund der Verbreitung immersiver Audioerfahrungen und -anwendungen, wie beispielsweise virtuelle und erweiterte Realität, zunehmend an Bedeutung. Für diese Zwecke werden 3D-Audiosignale häufig mittels Anordnungen von Ambisonics-Mikrofonen erfasst, wobei jedes Mikrofon aus vier Kapseln besteht, die das Schallfeld in sphärische Harmonische zerlegen. In diesem Artikel schlagen wir eine Darstellung des räumlichen Schallfeldes mittels Dualquaternionen vor, die durch eine Anordnung zweier Mikrofone erster Ordnung (First Order Ambisonics, FOA) erfasst wurde. Die Audiosignale werden in einer Dualquaternion zusammengefasst, die die Eigenschaften der Quaternionenalgebra nutzt, um Korrelationen zwischen den Signalen auszunutzen. Diese erweiterte Darstellung mit sechs Freiheitsgraden (6DOF) ermöglicht eine präzisere Abdeckung des Schallfeldes, was zu einer genaueren Schallquellenlokalisierung und einer immersiveren Audioerfahrung führt. Wir evaluieren unseren Ansatz anhand einer Benchmark für Schallaufgabenlokalisierung und -erkennung (Sound Event Localization and Detection, SELD). Die Ergebnisse zeigen, dass unser Dualquaternion-SELD-Modell mit temporalen Faltungsblöcken (DualQSELD-TCN) gegenüber realen und quaternionenwertigen Baseline-Modellen bessere Leistungen erzielt, was auf unsere erweiterte Schallfelddarstellung zurückzuführen ist. Der vollständige Quellcode ist unter folgender Adresse verfügbar: https://github.com/ispamm/DualQSELD-TCN.