HyperAIHyperAI
il y a 17 jours

WikiGUM : Liaison d'entités exhaustive pour la wikification dans 12 genres

Jessica Lin, Amir Zeldes
WikiGUM : Liaison d'entités exhaustive pour la wikification dans 12 genres
Résumé

Les travaux antérieurs sur le lien d'entités se sont concentrés sur des ressources ciblant des mentions d'entités propres non imbriquées, souvent issues de données provenant de Wikipedia, c’est-à-dire dans le cadre de la wikification. Dans cet article, nous présentons et évaluons WikiGUM, un jeu de données entièrement wikifié, couvrant toutes les mentions d'entités nommées, y compris leurs mentions non nommées et pronominales, ainsi que les mentions imbriquées dans d'autres mentions. Ce jeu de données englobe une large diversité de 12 genres, tant écrits que parlés, dont la plupart n’avaient pas été inclus dans les efforts antérieurs de lien d’entités, entraînant ainsi des performances médiocres d’un système pré-entraîné de pointe lors de notre évaluation. La disponibilité d’un large éventail d’autres annotations sur les mêmes données ouvre également la voie à des recherches complémentaires sur les entités dans leur contexte.