HyperAIHyperAI
il y a 17 jours

CHOLAN : Une approche modulaire pour le lien d'entités neurales sur Wikipedia et Wikidata

Manoj Prabhakar Kannan Ravi, Kuldeep Singh, Isaiah Onando Mulang&#39, , Saeedeh Shekarpour, Johannes Hoffart, Jens Lehmann
CHOLAN : Une approche modulaire pour le lien d'entités neurales sur Wikipedia et Wikidata
Résumé

Dans cet article, nous proposons CHOLAN, une approche modulaire destinée à réaliser le lien d’entités (Entity Linking, EL) bout-en-bout sur des bases de connaissances. CHOLAN repose sur une chaîne composée de deux modèles basés sur les transformateurs, intégrés séquentiellement pour accomplir la tâche d’EL. Le premier modèle de transformateur identifie les formes de surface (mentions d’entités) dans un texte donné. Pour chaque mention, un second modèle de transformateur est utilisé afin de classifier l’entité cible parmi une liste prédéfinie de candidats. Ce second modèle reçoit un contexte enrichi, extrait à la fois de la phrase (c’est-à-dire le contexte local) et de la description d’entité provenant de Wikipedia. Ces contextes externes n’ont pas été exploités dans les approches d’EL de pointe actuelles. Notre étude empirique a été menée sur deux bases de connaissances bien établies (à savoir Wikidata et Wikipedia). Les résultats expérimentaux montrent que CHOLAN surpasse les approches de pointe sur des jeux de données standards tels que CoNLL-AIDA, MSNBC, AQUAINT, ACE2004 et T-REx.