HyperAIHyperAI
il y a 2 mois

Évaluation de la Prononciation des Parlers Non-Natifs de l’Anglais à Base de Transformers et à Multiple Aspects et Granularités

Yuan Gong; Ziyi Chen; Iek-Heng Chu; Peng Chang; James Glass
Évaluation de la Prononciation des Parlers Non-Natifs de l’Anglais à Base de Transformers et à Multiple Aspects et Granularités
Résumé

L'évaluation automatique de la prononciation est une technologie importante pour aider les apprenants de langues autonomes. Bien que la qualité de la prononciation comporte plusieurs aspects, tels que la précision, la fluidité, l'exhaustivité et la prosodie, les travaux précédents ne modélisaient généralement qu'un seul aspect (par exemple, la précision) à un seul niveau de granularité (par exemple, au niveau des phonèmes). Dans cette étude, nous explorons la modélisation d'une évaluation de la prononciation à multiples aspects et à multiples niveaux de granularité. Plus précisément, nous entraînons un Transformers basé sur des caractéristiques du Goodness Of Pronunciation (GOPT) avec un apprentissage multi-tâches. Les expériences montrent que le GOPT obtient les meilleurs résultats sur Speechocean762 avec un modèle acoustique de reconnaissance automatique de la parole (ASR) formé publiquement sur Librispeech.

Évaluation de la Prononciation des Parlers Non-Natifs de l’Anglais à Base de Transformers et à Multiple Aspects et Granularités | Articles de recherche récents | HyperAI