HyperAIHyperAI

Command Palette

Search for a command to run...

vor 4 Monaten

Automatische Spracherkennung im Deutschen: Eine detaillierte Fehleranalyse

{René Peinl Johannes Wirth}

Automatische Spracherkennung im Deutschen: Eine detaillierte Fehleranalyse

Abstract

Die Anzahl an frei verfügbaren Systemen für automatische Spracherkennung (ASR) auf Basis neuronalen Netzwerke wächst stetig, wobei gleichzeitig die Zuverlässigkeit der Vorhersagen zunimmt. Die Bewertung geschulter Modelle basiert jedoch typischerweise ausschließlich auf statistischen Metriken wie WER (Word Error Rate) oder CER (Character Error Rate), die keinerlei Einblick in die Art oder Auswirkung der Fehler liefern, die bei der Vorhersage von Transkripten aus Spracheingaben entstehen. Diese Arbeit präsentiert eine Auswahl an ASR-Modellarchitekturen, die auf der deutschen Sprache vorgeschult wurden, und evaluiert diese anhand eines Benchmarks aus vielfältigen Testdatensätzen. Dabei werden überarchitekturübergreifende Vorhersagefehler identifiziert, in Kategorien eingeteilt und die Ursachen dieser Fehler pro Kategorie auf die Trainingsdaten sowie andere Quellen zurückverfolgt. Abschließend werden Lösungsansätze diskutiert, um qualitativ verbesserte Trainingsdatensätze zu erstellen und robusteren ASR-Systeme zu entwickeln.

Benchmarks

BenchmarkMethodikMetriken
automatic-speech-recognition-on-huiConformer Transducer
WER (%): 1.89%
automatic-speech-recognition-on-m-ailabsConformer Transducer
WER (%): 4.28%
automatic-speech-recognition-on-the-spokenConformer Transducer
WER (%): 8.04%
automatic-speech-recognition-on-voxforgeConformer Transducer
WER (%): 3.36%
automatic-speech-recognition-on-voxpopuliConformer Transducer (German)
WER (%): 8.98%
speech-recognition-on-common-voice-germanConformer Transducer (no LM)
Test WER: 6.28%
speech-recognition-on-tudaConformer-Transducer (no LM)
Test WER: 5.82%

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp