18 天前
TPLinker:通过词元对链接实现实体与关系的单阶段联合抽取
Yucheng Wang, Bowen Yu, Yueyang Zhang, Tingwen Liu, Hongsong Zhu, Limin Sun

摘要
近年来,从非结构化文本中抽取实体与关系受到越来越多关注,但这一任务仍面临巨大挑战,主要源于识别共享实体的重叠关系的内在难度。以往研究显示,联合学习能够带来显著的性能提升。然而,这些方法通常涉及一系列相互依赖的顺序步骤,在训练时依赖真实标签作为输入条件,而在推理阶段则需从零开始进行抽取,这种训练与推理之间的不一致导致了“暴露偏差”(exposure bias)问题,进而引发错误累积。为缓解该问题,本文提出一种单阶段联合抽取模型——TPLinker。该模型能够有效识别共享一个或两个实体的重叠关系,同时避免暴露偏差的影响。TPLinker将联合抽取任务建模为词元对连接问题,并引入一种新颖的“握手标注”(handshaking tagging)方案,该方案能够针对每种关系类型,对实体对的边界词元进行精准对齐。实验结果表明,TPLinker在重叠关系及多重关系抽取任务上表现显著优于现有方法,并在两个公开数据集上取得了当前最优(state-of-the-art)的性能。