HyperAIHyperAI

Command Palette

Search for a command to run...

ELDEN : Liaison d'entités améliorée à l'aide de graphes de connaissances densifiés

Priya Radhakrishnan Vasudeva Varma Partha Talukdar

Résumé

Les systèmes de liaison d'entités (Entity Linking, EL) visent à mapper automatiquement les mentions d'une entité dans un texte à l'entité correspondante dans un graphe de connaissances (Knowledge Graph, KG). Le degré de connectivité d'une entité au sein du KG affecte directement la capacité d'un système EL à lier correctement les mentions textuelles à l'entité dans le KG. Cela explique pourquoi de nombreux systèmes EL se comportent particulièrement bien pour les entités fortement connectées au sein du KG, mettant ainsi en évidence le rôle crucial de la densité du KG dans le processus de liaison d'entités. Dans cet article, nous proposons ELDEN (Entity Linking using Densified Knowledge Graphs), un système EL qui commence par densifier le KG à l’aide de statistiques de co-occurrence extraites d’un grand corpus de texte, puis utilise ce KG enrichi pour entraîner des représentations vectorielles d’entités (entity embeddings). La similarité entre entités mesurée à l’aide de ces embeddings entraînés conduit à une amélioration significative du processus de liaison d’entités. ELDEN surpasse les systèmes EL de pointe sur des jeux de données standard. Grâce à cette densification, ELDEN se distingue également par une performance satisfaisante pour les entités faiblement connectées dans le KG. L’approche proposée est simple, tout en étant hautement efficace. Nous avons rendu publique la code source et les données de ELDEN.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp