Vibravox: Ein Datensatz von französischer Sprache, aufgenommen mit Körperfühlsensorik

Vibravox ist ein Datensatz, der der Verordnung (EU) 2016/679 zum Schutz personenbezogener Daten (DSGVO) entspricht und Audiodaten von fünf verschiedenen Körperleitungs-Audiosensoren enthält: zwei Ohrmikrofone, zwei Knochenschall-Schwingungssensoren und einen Laryngophon. Der Datensatz beinhaltet zudem Audiodaten eines luftgetragenen Mikrofons, das als Referenz verwendet wurde. Das Vibravox-Korpus umfasst 38 Stunden an Sprachproben und physiologischen Geräuschen, die unter verschiedenen akustischen Bedingungen von 188 Teilnehmern aufgezeichnet wurden. Diese Bedingungen wurden durch einen hochwertigen Ambisonics-3D-Raumverteilungsverstärker erzeugt. Das Korpus enthält zudem Annotationen zu den Aufnahmebedingungen sowie linguistische Transkriptionen. Wir haben eine Reihe von Experimenten zu verschiedenen sprachbezogenen Aufgaben durchgeführt, darunter Spracherkennung, Sprachverbesserung und Sprecherverifikation. Diese Experimente wurden mit den neuesten Modellen durchgeführt, um deren Leistungsfähigkeit bei Signalen zu bewerten und zu vergleichen, die von den verschiedenen Audiosensoren des Vibravox-Datensatzes erfasst wurden. Das Ziel war es, ein besseres Verständnis der individuellen Eigenschaften dieser Sensoren zu gewinnen.