HyperAIHyperAI
vor 17 Tagen

Automatische Spracherkennung im Deutschen: Eine detaillierte Fehleranalyse

{René Peinl, Johannes Wirth}
Automatische Spracherkennung im Deutschen: Eine detaillierte Fehleranalyse
Abstract

Die Anzahl an frei verfügbaren Systemen für automatische Spracherkennung (ASR) auf Basis neuronalen Netzwerke wächst stetig, wobei gleichzeitig die Zuverlässigkeit der Vorhersagen zunimmt. Die Bewertung geschulter Modelle basiert jedoch typischerweise ausschließlich auf statistischen Metriken wie WER (Word Error Rate) oder CER (Character Error Rate), die keinerlei Einblick in die Art oder Auswirkung der Fehler liefern, die bei der Vorhersage von Transkripten aus Spracheingaben entstehen. Diese Arbeit präsentiert eine Auswahl an ASR-Modellarchitekturen, die auf der deutschen Sprache vorgeschult wurden, und evaluiert diese anhand eines Benchmarks aus vielfältigen Testdatensätzen. Dabei werden überarchitekturübergreifende Vorhersagefehler identifiziert, in Kategorien eingeteilt und die Ursachen dieser Fehler pro Kategorie auf die Trainingsdaten sowie andere Quellen zurückverfolgt. Abschließend werden Lösungsansätze diskutiert, um qualitativ verbesserte Trainingsdatensätze zu erstellen und robusteren ASR-Systeme zu entwickeln.

Automatische Spracherkennung im Deutschen: Eine detaillierte Fehleranalyse | Neueste Forschungsarbeiten | HyperAI