HyperAIHyperAI

Command Palette

Search for a command to run...

Automatische Spracherkennung im Deutschen: Eine detaillierte Fehleranalyse

René Peinl Johannes Wirth

Zusammenfassung

Die Anzahl an frei verfügbaren Systemen für automatische Spracherkennung (ASR) auf Basis neuronalen Netzwerke wächst stetig, wobei gleichzeitig die Zuverlässigkeit der Vorhersagen zunimmt. Die Bewertung geschulter Modelle basiert jedoch typischerweise ausschließlich auf statistischen Metriken wie WER (Word Error Rate) oder CER (Character Error Rate), die keinerlei Einblick in die Art oder Auswirkung der Fehler liefern, die bei der Vorhersage von Transkripten aus Spracheingaben entstehen. Diese Arbeit präsentiert eine Auswahl an ASR-Modellarchitekturen, die auf der deutschen Sprache vorgeschult wurden, und evaluiert diese anhand eines Benchmarks aus vielfältigen Testdatensätzen. Dabei werden überarchitekturübergreifende Vorhersagefehler identifiziert, in Kategorien eingeteilt und die Ursachen dieser Fehler pro Kategorie auf die Trainingsdaten sowie andere Quellen zurückverfolgt. Abschließend werden Lösungsansätze diskutiert, um qualitativ verbesserte Trainingsdatensätze zu erstellen und robusteren ASR-Systeme zu entwickeln.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp