HyperAIHyperAI

Command Palette

Search for a command to run...

Open Source Deutsche Distanz-Spracherkennung: Korpus und akustisches Modell

and Chris Biemann Max Mühlhäuser Stefan Radomski Evandro Gouvea Arvid Lange Benjamin Milde Stephan Radeck-Arneth

Zusammenfassung

Wir präsentieren einen neuen, frei verfügbaren Korpus für die deutsche Fernsprechverarbeitung und geben Wortfehlerquoten (WER) für zwei Open-Source-Spracherkennungssysteme an, die auf diesem Korpus trainiert wurden. Der Korpus wurde in einer kontrollierten Umgebung mit drei verschiedenen Mikrofonen aus einer Entfernung von einem Meter aufgenommen und umfasst 180 verschiedene Sprecher sowie insgesamt 36 Stunden Audioaufnahmen. Wir zeigen Erkennungsergebnisse mit dem Open-Source-Toolkit Kaldi (20,5 % WER) und PocketSphinx (39,6 % WER) und ermöglichen so die vollständige Open-Source-Lösung für die deutsche Fernsprechverarbeitung.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp