18 天前

用于文档级关系抽取的掩码图像重建网络

Liang Zhang, Yidong Cheng
用于文档级关系抽取的掩码图像重建网络
摘要

文档级关系抽取旨在从文档内部提取实体之间的关系。相较于句子级关系抽取,文档级关系抽取需要跨多个句子进行推理,以识别复杂的三元组关系。以往的研究通常通过在提及级别或实体级别的文档图上进行信息传播来完成推理,但忽略了关系之间的相互关联性。本文提出一种基于掩码图像重建网络(Masked Image Reconstruction network)的新型文档级关系抽取模型——DRE-MIR,将推理过程建模为一个掩码图像重建问题,从而捕捉关系之间的关联性。具体而言,我们首先利用编码模块获取实体特征,并基于这些特征构建实体对矩阵;随后,将该实体对矩阵视为一张图像,通过随机掩码并由推理模块恢复的过程,实现对关系间关联性的建模与捕捉。我们在三个公开的文档级关系抽取数据集(DocRED、CDR 和 GDA)上对所提模型进行了评估。实验结果表明,该模型在上述三个数据集上均取得了当前最优的性能,并在推理过程中展现出优异的抗噪声鲁棒性。