18 天前
文本中命名实体的鲁棒消歧
{Gerhard Weikum, Stefan Thater, Bilyana Taneva, Marc Spaniol, Manfred Pinkal, Hagen Fürstenau, Ilaria Bordino, Mohamed Amir Yosef, Johannes Hoffart}

摘要
在自然语言文本中消歧命名实体,是指将模糊名称的提及映射到知识库(如DBpedia或YAGO)中注册的规范实体(如人物或地点)。本文提出了一种稳健的集体消歧方法,该方法利用知识库中的上下文信息,并引入一种新型的一致性图(coherence graph)结构。该方法将以往的多种方法统一到一个综合性框架中,综合考虑三个关键指标:实体被提及的先验概率、提及上下文与候选实体上下文之间的相似性,以及所有提及所对应候选实体之间的整体一致性。该方法构建一个加权图,其中包含提及项与候选实体,进而计算出一个稠密子图,以近似最优的联合提及-实体映射结果。实验结果表明,该新方法在准确率方面显著优于以往方法,并在多种输入条件下均表现出良好的鲁棒性。