17 天前

基于隐式结构精炼的文档级关系抽取

Guoshun Nan, Zhijiang Guo, Ivan Sekulić, Wei Lu
基于隐式结构精炼的文档级关系抽取
摘要

文档级关系抽取需要整合文档内及跨多个句子的信息,并捕捉句间实体之间的复杂交互关系。然而,如何有效聚合文档中的相关信息仍是当前研究中的一个关键挑战。现有方法通常基于句法树、共指消解或从非结构化文本中提取的启发式规则,构建静态的文档级图结构来建模依赖关系。与以往难以捕捉丰富非局部交互关系的方法不同,本文提出一种新颖模型,通过自动推断潜在的文档级图结构,实现跨句子的关联推理能力。此外,我们进一步设计了一种优化策略,使模型能够逐步聚合相关信息,支持多跳推理。实验结果表明,该模型在大规模文档级关系抽取数据集DocRED上取得了59.05的F1分数,显著优于此前方法;同时在CDR和GDA数据集上也取得了新的最先进性能。大量分析进一步验证了该模型能够更准确地发现句间关系。