
摘要
生成方法最近已被证明在实体消歧和实体链接(即联合提及检测和消歧)方面非常有效。然而,先前提出的用于实体链接的自回归模型存在以下问题:i) 由于复杂的(深层)解码器导致的高计算成本,ii) 非并行解码过程,其复杂度随源序列长度增加而增加,iii) 需要大量数据进行训练。在这项工作中,我们提出了一种非常高效的方案,该方案可以对所有潜在提及进行并行自回归链接,并依赖于浅层且高效的解码器。此外,我们在生成目标中添加了一个额外的判别组件,即一个校正项,这使得我们可以直接优化生成器的排名。综合这些技术,它们解决了上述所有问题:我们的模型比之前的生成方法快70多倍,并且在标准英语数据集AIDA-CoNLL上的表现优于现有的最先进方法。源代码可在https://github.com/nicola-decao/efficient-autoregressive-EL 获取。