2ヶ月前

Vibravox: ボディコンダクションオーディオセンサで収録されたフランス語話者データセット

Julien Hauret, Malo Olivier, Thomas Joubaud, Christophe Langrenne, Sarah Poirée, Véronique Zimpfer, Éric Bavu
Vibravox: ボディコンダクションオーディオセンサで収録されたフランス語話者データセット
要約

Vibravoxは、一般データ保護規則(GDPR)に準拠したデータセットで、5種類の体伝導音センサを使用して収録された音声記録を含んでいます。これらのセンサは、2つのイヤーマイク、2つの骨伝導振動ピックアップ、およびラリンゴフォンです。データセットには、空中マイクを使用して収録された参考用の音声データも含まれています。Vibravoxコーパスには、188人の参加者が高次アンビソニックス3D空間化器によって異なる音響条件下で収録した38時間分の話声サンプルと生理学的音が含まれています。また、コーパスには収録条件に関する注釈と言語的な転写も含まれています。私たちは、音声認識、音声強化、話者認証などのさまざまな音声関連タスクについて一連の実験を行いました。これらの実験では、最先端のモデルを使用し、Vibravoxデータセットが提供する異なるオーディオセンサで捉えられた信号の性能を評価および比較しました。目的は、各センサの個別の特性をより深く理解することでした。