17 天前

通过显式提及-提及共指建模进行实体链接

{Andrew McCallum, Nicholas Monath, Rico Angell, Dhruv Agarwal}
通过显式提及-提及共指建模进行实体链接
摘要

学习实体提及(entity mention)的表示是现代实体链接系统中候选生成与链接预测的核心组成部分。本文提出并实证分析了一种新颖的训练方法,用于学习提及和实体的表示,该方法通过在跨文档的提及与实体之间构建最小生成树(即有向生成树,minimum spanning arborescences),显式建模提及间的共指关系。我们通过实验证明,该方法在零样本实体链接数据集(Zero-Shot Entity Linking)以及目前最大的公开生物医学数据集MedMentions上,显著提升了候选生成的召回率与链接准确率。此外,我们进一步表明,候选生成性能的提升带来了下游重排序模型质量的提高,从而在MedMentions数据集上实现了新的最优(SOTA)链接准确率。最后,我们还验证了所获得的改进提及表示在跨文档共指分析中对新实体发现的有效性。