17 天前

评估知识图谱上下文对实体消歧模型的影响

Isaiah Onando Mulang&#39, , Kuldeep Singh, Chaitali Prabhu, Abhishek Nadgeri, Johannes Hoffart, Jens Lehmann

摘要

预训练的Transformer模型已成为当前自然语言处理（NLP）任务中的前沿方法，能够从文本中学习上下文信息，显著提升多项任务的性能。尽管这类模型具备强大能力，但在特定场景下仍需依赖领域专业知识。本文提出，源自知识图谱（以Wikidata为例）的上下文信息足以为预训练Transformer模型提供有效信号，从而提升其在Wikidata知识图谱上的命名实体消歧（Named Entity Disambiguation, NED）任务表现。我们进一步假设，所提出的知识图谱上下文可被标准化应用于维基百科（Wikipedia）场景，并评估了该KG上下文对当前最先进的维基百科知识库NED模型的影响。实验结果表明，所提出的KG上下文具有良好的泛化能力（适用于维基百科），且在Transformer架构中引入KG上下文后，显著优于现有各类基线方法，包括原始的Transformer模型。