2 个月前

词和实体嵌入的联合学习用于命名实体消歧

Ikuya Yamada; Hiroyuki Shindo; Hideaki Takeda; Yoshiyasu Takefuji
词和实体嵌入的联合学习用于命名实体消歧
摘要

命名实体消歧(NED)是指将文档中多个命名实体提及解析为其在知识库(KB,例如维基百科)中的正确引用的任务。本文提出了一种专门为NED设计的新型嵌入方法。该方法将词语和实体共同映射到同一连续向量空间中。我们通过使用两个模型扩展了skip-gram模型。知识库图模型利用知识库的链接结构学习实体之间的相关性,而锚点上下文模型则通过利用知识库中的锚点及其上下文词汇,使相似的词语和实体在向量空间中彼此靠近。通过结合基于所提嵌入方法的上下文与标准的NED特征,我们在标准CoNLL数据集上达到了93.1%的最先进准确率,在TAC 2010数据集上达到了85.2%的准确率。