HyperAIHyperAI

Command Palette

Search for a command to run...

MAD-X : Un cadre fondé sur des adaptateurs pour le transfert multitasques et multilingue

Jonas Pfeiffer Ivan Vulić Iryna Gurevych Sebastian Ruder

Résumé

L'objectif principal des modèles multilingues pré-entraînés de pointe, tels que multilingual BERT et XLM-R, est de permettre et d'accélérer le développement d'applications de traitement automatique du langage (NLP) dans les langues à faibles ressources grâce au transfert multilingue zéro-shot ou few-shot. Toutefois, en raison de leur capacité limitée, leurs performances de transfert sont justement les plus faibles pour ces langues à faibles ressources, ainsi que pour les langues non observées durant l'étape de pré-entraînement. Nous proposons MAD-X, un cadre basé sur des adaptateurs qui permet un transfert hautement portable et efficace en termes de paramètres vers des tâches et des langues arbitraires, en apprenant des représentations modulaires spécifiques aux langues et aux tâches. En outre, nous introduisons une nouvelle architecture d'adaptateur inversible ainsi qu'une méthode de base performante pour adapter un modèle multilingue pré-entraîné à une nouvelle langue. MAD-X dépasse l'état de l'art en transfert multilingue sur un ensemble représentatif de langues typologiquement diverses, dans les tâches de reconnaissance d'entités nommées et de raisonnement causale sur le sens commun, tout en obtenant des résultats compétitifs sur la question-réponse. Le code source et les adaptateurs sont disponibles sur AdapterHub.ml.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
MAD-X : Un cadre fondé sur des adaptateurs pour le transfert multitasques et multilingue | Articles | HyperAI