HyperAIHyperAI

Command Palette

Search for a command to run...

Rompre la bouteille d'étranglement de softmax : un modèle de langage RNN de rang élevé

Zhilin Yang; Zihang Dai; Ruslan Salakhutdinov; William W. Cohen

Résumé

Nous formulons le modèle de langage comme un problème de factorisation matricielle et montrons que l'expressivité des modèles basés sur le Softmax (y compris la majorité des modèles de langage neuronaux) est limitée par une bouteille d'étranglement du Softmax. Étant donné que le langage naturel est fortement dépendant du contexte, cela implique en pratique que le Softmax avec des plongements de mots distribués n'a pas une capacité suffisante pour modéliser le langage naturel. Nous proposons une méthode simple et efficace pour résoudre ce problème, améliorant ainsi les perplexités les plus avancées sur Penn Treebank et WikiText-2 à 47,69 et 40,68 respectivement. La méthode proposée se distingue également sur le grand ensemble de données 1B Word, surpassant la ligne de base de plus de 5,6 points en termes de perplexité.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp