
摘要
实体链接(Entity Linking, EL)的主要挑战之一是在不同上下文中有效利用上下文信息来消歧指代维基百科的不同实体。这一问题在跨语言实体链接中尤为突出,因为该任务涉及将非英语文档中的提及链接到英语维基百科的条目:为了比较不同语言中的文本线索,我们需要计算跨语言文本片段之间的相似度。本文提出了一种神经EL模型,该模型从多个角度训练查询和候选文档之间的细粒度相似性和差异性,并结合卷积和张量网络技术。此外,我们展示了这种基于英语训练的系统可以通过零样本学习(zero-shot learning)应用于其他语言,通过出乎意料地高效利用多语言嵌入实现这一点。实验结果表明,所提出的系统不仅在英语数据集上取得了最先进的性能,在西班牙语和汉语TAC 2015数据集上的跨语言实体链接任务中也表现出色。