Vibravox : Une base de données de parole française capturée avec des capteurs audio par conduction corporelle

Vibravox est un ensemble de données conforme au Règlement Général sur la Protection des Données (RGPD) contenant des enregistrements audio réalisés à l'aide de cinq capteurs audio différents basés sur la conduction corporelle : deux microphones intra-auriculaires, deux capteurs de vibrations par conduction osseuse et un laryngophone. L'ensemble de données inclut également des données audio provenant d'un microphone aérien utilisé comme référence. Le corpus Vibravox comprend 38 heures d'échantillons vocaux et de sons physiologiques enregistrés par 188 participants dans différentes conditions acoustiques imposées par un spatialiseur 3D d'ordre élevé. Les annotations concernant les conditions d'enregistrement et les transcriptions linguistiques sont également incluses dans le corpus. Nous avons mené une série d'expériences sur diverses tâches liées à la parole, notamment la reconnaissance vocale, l'amélioration du discours et la vérification de l'identité du locuteur. Ces expériences ont été réalisées en utilisant des modèles de pointe pour évaluer et comparer leurs performances sur les signaux capturés par les différents capteurs audio proposés par le jeu de données Vibravox, dans le but d'acquérir une meilleure compréhension de leurs caractéristiques individuelles.