17 天前

编码器-解码器架构在联合实体与关系抽取中的有效建模

Tapas Nayak, Hwee Tou Ng
编码器-解码器架构在联合实体与关系抽取中的有效建模
摘要

关系元组由两个实体及其之间的关系构成,通常这类元组出现在非结构化文本中。一段文本中可能包含多个关系元组,这些元组之间可能共享一个或两个实体。从句子中抽取此类关系元组是一项具有挑战性的任务,尤其当元组之间存在实体共享或重叠时,难度进一步增加。以往大多数研究采用流水线式方法,先识别实体,再分析实体之间的关系,这种方法忽略了句子中各关系元组之间的相互作用。本文提出两种基于编码器-解码器架构的联合抽取实体与关系的方法。在第一种方法中,我们设计了一种关系元组的表示方案,使解码器能够像机器翻译模型一样逐词生成,同时仍能准确识别句子中所有存在的关系元组,包括不同长度的完整实体名称以及存在重叠实体的情况。第二种方法则基于指针网络的解码机制,在每个时间步生成一个完整的元组。在公开可用的《纽约时报》语料库上的实验结果表明,所提出的两种方法均优于先前的工作,显著提升了F1值。