18 天前

CorDEL:一种用于实体链接的对比深度学习方法

Zhengyang Wang, Bunyamin Sisman, Hao Wei, Xin Luna Dong, Shuiwang Ji
CorDEL:一种用于实体链接的对比深度学习方法
摘要

实体链接(Entity Linking, EL)是数据清洗与集成中的关键问题。在过去数十年中,EL通常依赖基于规则的系统或传统机器学习模型,并采用人工精心设计的特征,这些方法均高度依赖人工干预,成本较高。随着新数据的持续快速增长,基于深度学习(Deep Learning, DL)的方法被提出,以缓解传统模型在实体链接任务中所面临的高昂成本问题。然而,现有针对EL的深度学习研究严格遵循经典的双塔网络(twin-network)架构。我们认为,该架构并非EL任务的最优选择,导致现有模型存在固有缺陷。为解决这些问题,本文提出一种新颖且通用的对比学习深度学习框架用于实体链接。该框架能够同时捕捉句法与语义层面的匹配信号,并关注细微但至关重要的差异。基于该框架,我们进一步开发了一种名为CorDEL的对比学习实体链接方法,包含三种功能强大的变体。我们在多个公开基准数据集和一个真实世界数据集上进行了广泛的实验评估。实验结果表明,CorDEL在公开基准数据集上的性能超越了先前的最先进模型,平均提升达5.2%;在真实世界数据集上,相较于当前最优的深度学习模型,CorDEL实现了2.4%的性能提升,同时将训练参数数量减少了97.6%。