
摘要
近期在实体消歧(Entity Disambiguation, ED)领域的研究通常忽略了结构化知识库(Knowledge Base, KB)中的事实,而是依赖于知识库中的一小部分信息,如实体描述或类型。这限制了实体可以在其中进行消歧的上下文范围。为了利用所有知识库事实,以及描述和类型,我们提出了一种通过完全可微分的方式在符号知识库上进行推理的ED模型。该模型在六个知名的ED数据集上平均超越了现有的最先进基线方法1.3个F1分数。通过允许访问所有知识库信息,我们的模型减少了对基于流行度的实体先验的依赖,并在具有挑战性的ShadowLink数据集(强调不常见和模糊实体)上提高了12.7个F1分数的表现。