HyperAIHyperAI

Command Palette

Search for a command to run...

Transformerbasierte Mehraspekt-Mehrgranularität-Bewertung der Aussprache von Nichtmuttersprachlern des Englischen

Yuan Gong; Ziyi Chen; Iek-Heng Chu; Peng Chang; James Glass

Zusammenfassung

Die automatische Aussprachebewertung ist eine wichtige Technologie, die selbstgesteuerten Sprachenlerner unterstützt. Während die Aussprachekualität verschiedene Aspekte umfasst, darunter Genauigkeit, Flüssigkeit, Vollständigkeit und Prosodie, modellieren frühere Ansätze in der Regel nur einen Aspekt (z.B. Genauigkeit) auf einer bestimmten Granularitätsebene (z.B. auf Phonemebene). In dieser Arbeit untersuchen wir das Modellieren von mehreren Aspekten der Aussprachebewertung auf verschiedenen Granularitätsebenen. Insbesondere trainieren wir einen Goodness of Pronunciation-merkmalsbasierten Transformer (GOPT) mit Multi-Task-Lernen. Experimente zeigen, dass GOPT bei Verwendung eines öffentlich verfügbaren automatischen Spracherkennungsmodells (ASR), das auf Librispeech trainiert wurde, die besten Ergebnisse im Speechocean762-Datensatz erzielt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp