HyperAIHyperAI

Command Palette

Search for a command to run...

Modélisation linguistique par réseau de neurones utilisant des caractéristiques basées sur les lettres et un échantillonnage par importance

Xie Chen Sanjeev Khudanpur Ke Li Jian Wang Yiming Wang Daniel Povey Hainan Xu Shiyin Kang

Résumé

Dans cet article, nous décrivons une extension de l’outil logiciel Kaldi destinée à supporter la modélisation linguistique basée sur les réseaux de neurones, conçue pour être utilisée dans la reconnaissance automatique de la parole (ASR) et des tâches connexes. Nous combinons l’utilisation de caractéristiques de sous-mots (n-grammes de lettres) et du codage one-hot des mots fréquents afin que les modèles puissent gérer des vocabulaires de grande taille contenant des mots rares. Nous proposons une nouvelle fonction objectif permettant l’entraînement de probabilités non normalisées. Une méthode basée sur un échantillonnage d’importance est intégrée pour accélérer l’entraînement lorsque le vocabulaire est important. Les résultats expérimentaux obtenus sur cinq corpus montrent que Kaldi-RNNLM se compare avantageusement aux autres outils de modélisation linguistique à réseaux de neurones récurrents en termes de performance et de vitesse d’entraînement.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp