HyperAIHyperAI

Command Palette

Search for a command to run...

Apprentissage conjoint de l'embedding des mots et des entités pour la désambiguïsation des entités nommées

Ikuya Yamada Hiroyuki Shindo Hideaki Takeda Yoshiyasu Takefuji

Résumé

La désambiguïsation d'entités nommées (Désambiguïsation des Entités Nommées - DEN) fait référence à la tâche de résoudre les multiples mentions d'entités nommées dans un document en les reliant à leurs références correctes dans une base de connaissances (Base de Connaissances - BC) (par exemple, Wikipedia). Dans cet article, nous proposons une nouvelle méthode d'embedding spécifiquement conçue pour la DEN. La méthode proposée mappe conjointement les mots et les entités dans le même espace vectoriel continu. Nous étendons le modèle skip-gram en utilisant deux modèles. Le modèle de graphe BC apprend la pertinence des entités en utilisant la structure de liens de la BC, tandis que le modèle de contexte d'ancre vise à aligner les vecteurs de manière à ce que des mots et des entités similaires se trouvent proches les uns des autres dans l'espace vectoriel, en exploitant les ancres de la BC et leurs mots contextuels. En combinant les contextes basés sur l'embedding proposé avec des caractéristiques standard de DEN, nous avons atteint une précision d'état de l'art de 93,1 % sur l'ensemble de données standard CoNLL et de 85,2 % sur l'ensemble de données TAC 2010.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp