HyperAIHyperAI

Command Palette

Search for a command to run...

mLUKE : La Puissance des Représentations d'Entités dans les Modèles de Langue Pré-entraînés Multilingues

Ryokan Ri Ikuya Yamada Yoshimasa Tsuruoka

Résumé

Des études récentes ont montré que les modèles de langage préentraînés multilingues peuvent être améliorés de manière efficace grâce aux informations d'alignement interlinguistique provenant des entités de Wikipédia. Cependant, les méthodes existantes n'exploitent ces informations d'entité qu'au cours du préentraînement et ne les utilisent pas explicitement dans les tâches en aval. Dans cette étude, nous explorons l'efficacité de l'utilisation des représentations d'entités pour les tâches interlinguistiques en aval. Nous entraînons un modèle de langage multilingue avec 24 langues en intégrant des représentations d'entités et démontrons que ce modèle surpasse constamment les modèles préentraînés basés sur les mots dans diverses tâches de transfert interlinguistique. Nous analysons également le modèle, dont la principale conclusion est que l'intégration des représentations d'entités à l'entrée permet d'extraire davantage de caractéristiques indépendantes du langage. En outre, nous évaluons le modèle à travers une tâche de complétion multilingue à partir du jeu de données mLAMA. Nous montrons que les prompts basés sur les entités sont plus susceptibles d'évoquer des connaissances factuelles correctes que ceux utilisant uniquement des représentations de mots. Notre code source et nos modèles préentraînés sont disponibles à l'adresse suivante : https://github.com/studio-ousia/luke.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp