HyperAIHyperAI

Command Palette

Search for a command to run...

LUKE : Représentations contextualisées profondes d'entités avec une attention auto-attention sensible aux entités

Ikuya Yamada Akari Asai Hiroyuki Shindo Hideaki Takeda Yuji Matsumoto

Résumé

Les représentations d’entités sont utiles dans les tâches de traitement du langage naturel impliquant des entités. Dans cet article, nous proposons de nouvelles représentations préentraînées contextuelles pour les mots et les entités, fondées sur le transformateur bidirectionnel. Le modèle proposé traite les mots et les entités présents dans un texte donné comme des jetons indépendants, et produit des représentations contextuelles pour chacun d’eux. Notre modèle est entraîné à l’aide d’une nouvelle tâche de préentraînement basée sur le modèle de langage masqué (masked language model) de BERT. Cette tâche consiste à prédire des mots et des entités aléatoirement masqués dans un grand corpus annoté d’entités extrait de Wikipedia. Nous proposons également un mécanisme d’attention auto-attentive sensible aux entités, qui constitue une extension du mécanisme d’attention du transformateur, et qui prend en compte le type de jeton (mot ou entité) lors du calcul des scores d’attention. Le modèle proposé obtient des performances empiriques remarquables sur une large gamme de tâches liées aux entités. En particulier, il atteint des résultats de pointe sur cinq jeux de données bien connus : Open Entity (typage d’entités), TACRED (classification de relations), CoNLL-2003 (reconnaissance d’entités nommées), ReCoRD (question réponse du type cloze) et SQuAD 1.1 (question réponse extraite). Le code source et les représentations préentraînées sont disponibles à l’adresse suivante : https://github.com/studio-ousia/luke.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp