vor 17 Tagen
Open Source Deutsche Distanz-Spracherkennung: Korpus und akustisches Modell
{and Chris Biemann, Max Mühlhäuser, Stefan Radomski, Evandro Gouvea, Arvid Lange, Benjamin Milde, Stephan Radeck-Arneth}

Abstract
Wir präsentieren einen neuen, frei verfügbaren Korpus für die deutsche Fernsprechverarbeitung und geben Wortfehlerquoten (WER) für zwei Open-Source-Spracherkennungssysteme an, die auf diesem Korpus trainiert wurden. Der Korpus wurde in einer kontrollierten Umgebung mit drei verschiedenen Mikrofonen aus einer Entfernung von einem Meter aufgenommen und umfasst 180 verschiedene Sprecher sowie insgesamt 36 Stunden Audioaufnahmen. Wir zeigen Erkennungsergebnisse mit dem Open-Source-Toolkit Kaldi (20,5 % WER) und PocketSphinx (39,6 % WER) und ermöglichen so die vollständige Open-Source-Lösung für die deutsche Fernsprechverarbeitung.