HyperAIHyperAI
il y a 2 mois

Apprentissage conjoint de l'embedding des mots et des entités pour la désambiguïsation des entités nommées

Ikuya Yamada; Hiroyuki Shindo; Hideaki Takeda; Yoshiyasu Takefuji
Apprentissage conjoint de l'embedding des mots et des entités pour la désambiguïsation des entités nommées
Résumé

La désambiguïsation d'entités nommées (Désambiguïsation des Entités Nommées - DEN) fait référence à la tâche de résoudre les multiples mentions d'entités nommées dans un document en les reliant à leurs références correctes dans une base de connaissances (Base de Connaissances - BC) (par exemple, Wikipedia). Dans cet article, nous proposons une nouvelle méthode d'embedding spécifiquement conçue pour la DEN. La méthode proposée mappe conjointement les mots et les entités dans le même espace vectoriel continu. Nous étendons le modèle skip-gram en utilisant deux modèles. Le modèle de graphe BC apprend la pertinence des entités en utilisant la structure de liens de la BC, tandis que le modèle de contexte d'ancre vise à aligner les vecteurs de manière à ce que des mots et des entités similaires se trouvent proches les uns des autres dans l'espace vectoriel, en exploitant les ancres de la BC et leurs mots contextuels. En combinant les contextes basés sur l'embedding proposé avec des caractéristiques standard de DEN, nous avons atteint une précision d'état de l'art de 93,1 % sur l'ensemble de données standard CoNLL et de 85,2 % sur l'ensemble de données TAC 2010.

Apprentissage conjoint de l'embedding des mots et des entités pour la désambiguïsation des entités nommées | Articles de recherche récents | HyperAI