HyperAIHyperAI

Command Palette

Search for a command to run...

Transducteur léger basé sur un critère au niveau des trames

Genshun Wan Mengzhi Wang Tingzhi Mao Hang Chen* Zhongfu Ye

Résumé

Le modèle de transducteur formé sur la base d'un critère au niveau des séquences nécessite une grande quantité de mémoire en raison de la génération d'une matrice de probabilité importante. Nous avons proposé un modèle de transducteur léger basé sur un critère au niveau des trames, qui utilise les résultats de l'algorithme d'alignement forcé CTC pour déterminer l'étiquette de chaque trame. Ensuite, la sortie du codificateur peut être combinée avec la sortie du décodeur à l'instant correspondant, plutôt que d'ajouter chaque élément produit par le codificateur à chaque élément produit par le décodeur, comme c'est le cas dans le transducteur. Ceci réduit considérablement les exigences en mémoire et en calcul. Pour résoudre le problème de classification déséquilibrée causé par un excès de blancs dans les étiquettes, nous avons dissocié les probabilités de blanc et non-blanc et tronqué le gradient du classifieur de blanc vers le réseau principal. Les expériences menées sur AISHELL-1 montrent que cela permet au transducteur léger d'obtenir des résultats similaires à ceux du transducteur. De plus, nous utilisons des informations plus riches pour prédire la probabilité de blanc, obtenant ainsi des résultats supérieurs à ceux du transducteur.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp