HyperAIHyperAI

Command Palette

Search for a command to run...

TransferTransfo : Une approche d'apprentissage par transfert pour les agents conversationnels basés sur les réseaux de neurones

Thomas Wolf Victor Sanh Julien Chaumond Clement Delangue

Résumé

Nous présentons une nouvelle approche pour les systèmes de dialogue génératifs pilotés par les données (par exemple, les chatbots) appelée TransferTransfo, qui combine un schéma d'entraînement basé sur le transfert d'apprentissage et un modèle Transformer à haute capacité. L'ajustement fin est effectué en utilisant un objectif multi-tâches qui combine plusieurs tâches de prédiction non supervisées. Le modèle ajusté finalement montre des améliorations significatives par rapport aux modèles conversationnels end-to-end actuels comme les séquences à séquences augmentées par la mémoire et les modèles de recherche d'information. Sur le jeu de données privé PERSONA-CHAT du Défi d'Intelligence Conversationnelle 2, cette approche obtient un nouveau niveau d'excellence, avec respectivement des métriques de perplexité, Hits@1 et F1 de 16,28 (amélioration absolue de 45 %), 80,7 (amélioration absolue de 46 %) et 19,5 (amélioration absolue de 20 %).


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
TransferTransfo : Une approche d'apprentissage par transfert pour les agents conversationnels basés sur les réseaux de neurones | Articles | HyperAI