11 天前
基于集合预测网络的联合实体与关系抽取
Dianbo Sui, Yubo Chen, Kang Liu, Jun Zhao, Xiangrong Zeng, Shengping Liu

摘要
联合实体与关系抽取任务旨在从一个句子中提取出所有关系三元组。本质上,句子中包含的关系三元组是无序的。然而,以往基于序列到序列(seq2seq)的模型在训练阶段需要将三元组集合转换为有序序列,这一过程引入了对三元组顺序的依赖,成为性能瓶颈。为突破这一限制,我们提出将联合实体与关系抽取建模为直接的集合预测问题,从而使抽取模型无需承担预测多个三元组顺序的负担。为解决该集合预测问题,我们提出一种基于Transformer架构、采用非自回归并行解码机制的网络结构。与传统自回归方法逐个生成三元组(按特定顺序)不同,所提出的网络能够一次性直接输出最终的三元组集合。此外,我们还设计了一种基于集合的损失函数,通过二分图匹配机制强制模型产生唯一性预测。与对三元组顺序微小变化高度敏感的交叉熵损失相比,所提出的二分图匹配损失对预测结果的任意排列均保持不变;因此,该损失函数能够忽略三元组顺序,聚焦于关系类型与实体本身的准确性,为模型提供更精准的训练信号。在两个基准数据集上的实验结果表明,所提出的模型显著优于当前最先进的方法。训练代码与训练好的模型将公开于:http://github.com/DianboWork/SPN4RE。