HyperAIHyperAI

Command Palette

Search for a command to run...

Apprentissage de représentations de phrases distribuées à usage général par apprentissage multi-tâches à grande échelle

Sandeep Subramanian; Adam Trischler; Yoshua Bengio; Christopher J Pal

Résumé

Le succès récent dans le traitement automatique des langues naturelles (TALN) a été largement attribué aux représentations vectorielles distribuées de mots formées à partir de grands volumes de texte de manière non supervisée. Ces représentations sont généralement utilisées comme caractéristiques polyvalentes pour les mots dans divers problèmes de TALN. Cependant, étendre ce succès à l'apprentissage de représentations de séquences de mots, telles que des phrases, reste un problème ouvert. Des travaux récents ont exploré des techniques d'apprentissage non supervisé ainsi que supervisé avec différents objectifs d'entraînement pour apprendre des représentations polyvalentes et de longueur fixe des phrases. Dans cette étude, nous présentons un cadre simple et efficace d'apprentissage multitâche pour les représentations de phrases qui combine les biais inductifs d'objectifs d'entraînement variés au sein d'un seul modèle. Nous entraînons ce modèle sur plusieurs sources de données avec plusieurs objectifs d'entraînement sur plus de 100 millions de phrases. De nombreuses expériences montrent que le partage d'un unique encodeur récurrent de phrases entre des tâches faiblement liées conduit à des améliorations constantes par rapport aux méthodes précédentes. Nous présentons des améliorations substantielles dans le contexte du transfert d'apprentissage et des configurations à ressources limitées en utilisant nos représentations polyvalentes apprises.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp