
摘要
关系抽取(Relation Extraction, RE)旨在识别文本中命名实体之间的语义关系。近年来,该任务已逐步扩展至文档级别,要求模型在整篇文档范围内对实体及其提及进行复杂的推理。本文提出一种新型文档级关系抽取模型,通过融合实体的全局表示、局部表示以及上下文关系表示来编码文档信息。其中,实体全局表示用于建模文档中所有实体的语义信息,实体局部表示则聚合特定实体多个提及的上下文信息,而上下文关系表示用于编码其他关系的主题信息。实验结果表明,该模型在两个公开的文档级关系抽取数据集上均取得了优异性能,尤其在远距离实体间关系抽取以及具有多个提及的实体关系抽取任务中表现出显著优势。