17 天前

粗粒度到细粒度的实体表示用于文档级关系抽取

Damai Dai, Jing Ren, Shuang Zeng, Baobao Chang, Zhifang Sui
粗粒度到细粒度的实体表示用于文档级关系抽取
摘要

文档级关系抽取(Document-Level Relation Extraction, RE)旨在识别句子内部及跨句子表达的关系。近年来的研究表明,基于图的方法通过构建捕捉文档级上下文感知交互的文档级图结构,能够获得更具意义的实体表示,从而有效提升文档级关系抽取的性能。现有方法通常侧重于整个图结构的建模,或仅关注图中特定部分,例如目标实体对之间的路径信息。然而,我们发现,同时兼顾整体图结构与局部路径信息,可能更有利于文档级关系抽取任务。为此,为获取更全面的实体表示,我们提出了一种粗粒度到细粒度的实体表示模型(Coarse-to-Fine Entity Representation, CFER),该模型采用分阶段的粗粒度到细粒度策略,包含两个阶段:首先,CFER利用图神经网络在粗粒度层面整合整个图的全局信息;随后,利用该全局信息作为引导,精细地选择性聚合目标实体对之间的路径信息。在分类阶段,我们将两个层次的实体表示进行融合,生成更为全面的表示以用于关系抽取。在两个主流文档级关系抽取数据集DocRED和CDR上的实验结果表明,CFER显著优于现有模型,并在标签分布不均衡的情况下仍表现出良好的鲁棒性。