2달 전
Vibravox: 신체 전도 오디오 센서로 캡처된 프랑스어 발화 데이터셋
Julien Hauret, Malo Olivier, Thomas Joubaud, Christophe Langrenne, Sarah Poirée, Véronique Zimpfer, Éric Bavu

초록
Vibravox는 일반 데이터 보호 규정(GDPR)에 준거한 데이터셋으로, 5가지 다른 체내 전도 오디오 센서를 사용하여 녹음된 오디오 기록을 포함하고 있습니다: 이어 마이크 2개, 뼈 진동 수신기 2개, 그리고 후두폰입니다. 이 데이터셋은 또한 참조용으로 사용된 공중 전파 마이크의 오디오 데이터를 포함하고 있습니다. Vibravox 코퍼스는 고차 아비소닉스 3D 스페이셜라이저에 의해 강제된 다양한 음향 조건 하에서 188명의 참여자들이 녹음한 38시간 분량의 음성 샘플과 생리적 소리를 포함하고 있습니다. 코퍼스에는 녹음 조건에 대한 주석과 언어학적 전사도 포함되어 있습니다. 우리는 음성 인식, 음성 향상, 화자 검증 등 다양한 음성 관련 작업을 수행하기 위해 일련의 실험을 실시했습니다. 이러한 실험들은 최신 모델들을 사용하여 Vibravox 데이터셋에서 제공하는 다양한 오디오 센서로 캡처된 신호들의 성능을 평가하고 비교하기 위해 수행되었으며, 각 센서의 개별 특성을 더 잘 이해하는 것을 목표로 하고 있습니다.