HyperAIHyperAI
il y a 18 jours

ELDEN : Liaison d'entités améliorée à l'aide de graphes de connaissances densifiés

{Priya Radhakrishnan, Vasudeva Varma, Partha Talukdar}
ELDEN : Liaison d'entités améliorée à l'aide de graphes de connaissances densifiés
Résumé

Les systèmes de liaison d'entités (Entity Linking, EL) visent à mapper automatiquement les mentions d'une entité dans un texte à l'entité correspondante dans un graphe de connaissances (Knowledge Graph, KG). Le degré de connectivité d'une entité au sein du KG affecte directement la capacité d'un système EL à lier correctement les mentions textuelles à l'entité dans le KG. Cela explique pourquoi de nombreux systèmes EL se comportent particulièrement bien pour les entités fortement connectées au sein du KG, mettant ainsi en évidence le rôle crucial de la densité du KG dans le processus de liaison d'entités. Dans cet article, nous proposons ELDEN (Entity Linking using Densified Knowledge Graphs), un système EL qui commence par densifier le KG à l’aide de statistiques de co-occurrence extraites d’un grand corpus de texte, puis utilise ce KG enrichi pour entraîner des représentations vectorielles d’entités (entity embeddings). La similarité entre entités mesurée à l’aide de ces embeddings entraînés conduit à une amélioration significative du processus de liaison d’entités. ELDEN surpasse les systèmes EL de pointe sur des jeux de données standard. Grâce à cette densification, ELDEN se distingue également par une performance satisfaisante pour les entités faiblement connectées dans le KG. L’approche proposée est simple, tout en étant hautement efficace. Nous avons rendu publique la code source et les données de ELDEN.