17 天前

HySPA:面向可扩展文本到图谱抽取的混合跨度生成方法

Liliang Ren, Chenkai Sun, Heng Ji, Julia Hockenmaier
HySPA:面向可扩展文本到图谱抽取的混合跨度生成方法
摘要

文本到图谱抽取旨在从自然语言文本中自动提取由实体提及及其类型构成的信息图谱。现有的方法,如表格填充和成对评分,已在多种信息抽取任务中展现出优异的性能,但由于其时间与空间复杂度随输入长度呈二次增长,难以扩展至包含长文本的数据集。为此,本文提出一种混合跨度生成器(HySPA),该方法可将信息图谱可逆地映射为节点与边类型交替组成的序列,并通过一种混合跨度解码器直接生成此类序列。该解码器能够以线性时间与空间复杂度,递归地同时解码实体跨度与类型。在ACE05数据集上的大量实验表明,该方法在联合实体与关系抽取任务上显著优于当前最先进的技术水平。