2 个月前

文档级实体抽取作为模板生成

Kung-Hsiang Huang; Sam Tang; Nanyun Peng
文档级实体抽取作为模板生成
摘要

文档级实体抽取(Document-level Entity Extraction, EE)旨在从文本语料库中提取以实体为中心的信息,如实体角色和实体关系,对于多个领域的自动知识获取至关重要。大多数文档级EE系统构建的是抽取模型,这些模型在文档层面难以建模实体之间的长程依赖关系。为了解决这一问题,我们提出了一种生成框架,用于两个文档级EE任务:角色填充实体抽取(Role-Filler Entity Extraction, REE)和关系抽取(Relation Extraction, RE)。我们首先将这两个任务形式化为模板生成问题,使模型能够高效地捕捉跨实体依赖关系,利用标签语义,并避免识别N元关系时的指数计算复杂度。我们将一种新颖的交叉注意力引导复制机制——TopK Copy——融入预训练的序列到序列模型中,以增强模型在输入文档中识别关键信息的能力。实验结果表明,在MUC-4和SciREX数据集上,该方法在REE(+3.26%)、二元RE(+4.8%)和四元RE(+2.7%)的F1分数上均取得了新的最佳结果。

文档级实体抽取作为模板生成 | 最新论文 | HyperAI超神经