11일 전
6자유도 음향 표현을 위한 이중 사원수 아미보닉스 어레이
Eleonora Grassucci, Gioia Mancini, Christian Brignone, Aurelio Uncini, Danilo Comminiello

초록
공간 음향 기법은 가상현실(VR) 및 증강현실(AR)과 같은 몰입형 음향 경험 및 응용 분야의 확산으로 인해 점점 더 많은 관심을 받고 있다. 이러한 목적을 위해 3차원(3D) 음향 신호는 일반적으로 4개의 캡슐을 갖는 아미보닉스(Ambisonics) 마이크로폰 어레이를 통해 획득되며, 이는 음향장을 구면 조화함수(spherical harmonics)로 분해한다. 본 논문에서는 1차 아미보닉스(First Order Ambisonics, FOA) 마이크로폰 2개로 구성된 어레이를 통해 획득한 공간 음향장을 이중 퀘aternion(dual quaternion) 표현으로 제안한다. 이 방식은 퀘aternion 대수의 성질을 활용하여 음향 신호 간의 상관관계를 효과적으로 활용하는 이중 퀘aternion에 음향 신호를 포함시킨다. 6자유도(6DOF)를 갖는 본 증강된 표현은 음향장에 대한 보다 정확한 커버리지를 가능하게 하여, 더 정밀한 음원 위치 추정과 더 몰입감 있는 음향 경험을 제공한다. 제안한 방법은 음향 이벤트 위치 추정 및 탐지(SELD) 벤치마크에서 평가되었으며, 시간적 컨볼루션 블록(temporal convolution blocks)을 갖는 이중 퀘aternion 기반 SELD 모델(DualQSELD-TCN)이 실수 및 퀘aternion 값을 갖는 기준 모델 대비 우수한 성능을 보임을 보여준다. 전체 코드는 다음 주소에서 공개되어 있다: https://github.com/ispamm/DualQSELD-TCN.