HyperAIHyperAI

Command Palette

Search for a command to run...

Reconnaissance vocale de bout en bout avec étapes de calcul adaptatives

Mohan Li Min Liu Hattori Masanori

Résumé

Dans cet article, nous présentons l'algorithme de Pas de Calcul Adaptatif (Adaptive Computation Steps - ACS), qui permet aux modèles de reconnaissance vocale de bout en bout de décider dynamiquement du nombre de trames à traiter pour prédire une sortie linguistique. Le modèle utilisant l'algorithme ACS s'inscrit dans le cadre encodeur-décodeur, tout en différant des modèles basés sur l'attention par la production d'alignements indépendamment au niveau de l'encodeur, en utilisant la corrélation entre les trames adjacentes. Ainsi, des prédictions peuvent être faites dès que suffisamment d'informations acoustiques sont reçues, ce qui rend le modèle applicable dans des cas en ligne. De plus, une petite modification est apportée à l'étape de décodage du cadre encodeur-décodeur, permettant à la prédiction d'exploiter des contextes bidirectionnels. Nous avons vérifié l'algorithme ACS sur un corpus vocal mandarin AIShell-1, où il atteint un taux d'erreur caractère (CER) de 31,2 % dans le cas en ligne, contre 32,4 % pour le modèle basé sur l'attention. Pour démontrer pleinement l'avantage de l'algorithme ACS, des expériences hors ligne ont été menées, au cours desquelles notre modèle ACS a atteint un CER de 18,7 %, surpassant le modèle basé sur l'attention avec un CER de 22,0 %.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Reconnaissance vocale de bout en bout avec étapes de calcul adaptatives | Articles | HyperAI