HyperAIHyperAI

Command Palette

Search for a command to run...

Évaluation de la Prononciation des Parlers Non-Natifs de l’Anglais à Base de Transformers et à Multiple Aspects et Granularités

Yuan Gong; Ziyi Chen; Iek-Heng Chu; Peng Chang; James Glass

Résumé

L'évaluation automatique de la prononciation est une technologie importante pour aider les apprenants de langues autonomes. Bien que la qualité de la prononciation comporte plusieurs aspects, tels que la précision, la fluidité, l'exhaustivité et la prosodie, les travaux précédents ne modélisaient généralement qu'un seul aspect (par exemple, la précision) à un seul niveau de granularité (par exemple, au niveau des phonèmes). Dans cette étude, nous explorons la modélisation d'une évaluation de la prononciation à multiples aspects et à multiples niveaux de granularité. Plus précisément, nous entraînons un Transformers basé sur des caractéristiques du Goodness Of Pronunciation (GOPT) avec un apprentissage multi-tâches. Les expériences montrent que le GOPT obtient les meilleurs résultats sur Speechocean762 avec un modèle acoustique de reconnaissance automatique de la parole (ASR) formé publiquement sur Librispeech.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp