17 天前

一种用于关系三元组抽取的新型级联二值标记框架

Zhepei Wei, Jianlin Su, Yue Wang, Yuan Tian, Yi Chang
一种用于关系三元组抽取的新型级联二值标记框架
摘要

从非结构化文本中提取关系三元组是构建大规模知识图谱的关键步骤。然而,现有方法在处理“重叠三元组”问题上表现不佳——即同一句子中多个关系三元组共享相同实体的情况。本文提出一种全新的视角重新审视关系三元组抽取任务,并基于严谨的问题建模,提出一种新颖的级联二元标注框架(CasRel)。与以往将关系视为离散标签的方法不同,本框架将关系建模为从主语到宾语的函数映射,能够自然地解决重叠三元组问题。实验结果表明,即使在编码器模块仅使用随机初始化的BERT时,CasRel框架已显著优于当前最优方法,充分展现了新标注框架的强大能力。当采用预训练的BERT编码器时,性能进一步提升,在两个公开数据集NYT和WebNLG上,F1分数分别比最强基线高出17.5和30.2个百分点。对各类重叠三元组场景的深入分析显示,该方法在所有场景下均实现了稳定且一致的性能提升。相关源代码与数据已公开发布。

一种用于关系三元组抽取的新型级联二值标记框架 | 最新论文 | HyperAI超神经