2 个月前

基于融合实体解码的实体消歧

Junxiong Wang; Ali Mousavi; Omar Attia; Ronak Pradeep; Saloni Potdar; Alexander M. Rush; Umar Farooq Minhas; Yunyao Li
基于融合实体解码的实体消歧
摘要

实体消歧(ED)是指将文本中模糊实体的提及链接到知识库中的相应实体,是实体链接(EL)的核心组成部分。现有的生成式方法在标准化的ZELDA基准测试中表现出比分类方法更高的准确性。然而,生成式方法存在需要大规模预训练和生成效率低下的问题。尤为重要的是,实体描述通常包含区分相似实体的关键信息,但这些信息往往被忽视。我们提出了一种编码器-解码器模型,通过使用更加详细的实体描述来消歧实体。给定文本和候选实体后,编码器学习文本与每个候选实体之间的交互关系,为每个候选实体生成表示。然后,解码器将这些候选实体的表示融合在一起,并选择正确的实体。我们在多个实体消歧基准测试上进行了实验,结果表明该模型具有强大且稳健的性能,在ZELDA基准测试中相比GENRE提高了1.5%。此外,我们将这种方法集成到检索/阅读框架中,在GERBIL基准测试的端到端实体链接任务中观察到相比EntQA提升了1.5%的效果。