HyperAIHyperAI
vor 17 Tagen

Open Source Deutsche Distanz-Spracherkennung: Korpus und akustisches Modell

{and Chris Biemann, Max Mühlhäuser, Stefan Radomski, Evandro Gouvea, Arvid Lange, Benjamin Milde, Stephan Radeck-Arneth}
Open Source Deutsche Distanz-Spracherkennung: Korpus und akustisches Modell
Abstract

Wir präsentieren einen neuen, frei verfügbaren Korpus für die deutsche Fernsprechverarbeitung und geben Wortfehlerquoten (WER) für zwei Open-Source-Spracherkennungssysteme an, die auf diesem Korpus trainiert wurden. Der Korpus wurde in einer kontrollierten Umgebung mit drei verschiedenen Mikrofonen aus einer Entfernung von einem Meter aufgenommen und umfasst 180 verschiedene Sprecher sowie insgesamt 36 Stunden Audioaufnahmen. Wir zeigen Erkennungsergebnisse mit dem Open-Source-Toolkit Kaldi (20,5 % WER) und PocketSphinx (39,6 % WER) und ermöglichen so die vollständige Open-Source-Lösung für die deutsche Fernsprechverarbeitung.