il y a 17 jours
Reconnaissance automatique de la parole à distance allemande open source : corpus et modèle acoustique
{and Chris Biemann, Max Mühlhäuser, Stefan Radomski, Evandro Gouvea, Arvid Lange, Benjamin Milde, Stephan Radeck-Arneth}

Résumé
Nous présentons un nouveau corpus librement disponible pour la reconnaissance vocale à distance en allemand, ainsi que les résultats en taux d’erreur de mot (WER) indépendants du locuteur pour deux moteurs de reconnaissance vocale open source entraînés sur ce corpus. Le corpus a été enregistré dans un environnement contrôlé à l’aide de trois microphones différents, à une distance de un mètre. Il comprend 180 locuteurs différents, pour un total de 36 heures d’enregistrements audio. Nous présentons des résultats de reconnaissance obtenus avec l’outil open source Kaldi (20,5 % de WER) et PocketSphinx (39,6 % de WER), rendant ainsi possible une solution entièrement open source pour la reconnaissance vocale à distance en allemand.