HyperAIHyperAI

Command Palette

Search for a command to run...

Évaluation Dynamique des Modèles de Séquences Neurales

Ben Krause; Emmanuel Kahembwe; Iain Murray; Steve Renals

Résumé

Nous présentons une méthodologie pour l'utilisation de l'évaluation dynamique afin d'améliorer les modèles de séquences neuronaux. Les modèles sont adaptés à l'historique récent grâce à un mécanisme basé sur la descente de gradient, ce qui leur permet d'attribuer des probabilités plus élevées aux motifs séquentiels récurrents. L'évaluation dynamique surpasses les approches d'adaptation existantes dans nos comparaisons. L'évaluation dynamique améliore les performances en termes de perplexité au niveau des mots sur les jeux de données Penn Treebank et WikiText-2, atteignant respectivement 51,1 et 44,3, ainsi que les performances en termes d'entropie croisée au niveau des caractères sur les jeux de données text8 et Hutter Prize, atteignant respectivement 1,19 bit/char et 1,08 bit/char.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp