2 个月前
统一结构生成用于通用信息抽取
Yaojie Lu; Qing Liu; Dai Dai; Xinyan Xiao; Hongyu Lin; Xianpei Han; Le Sun; Hua Wu

摘要
信息抽取面临着目标多变、结构异质和需求特定模式的挑战。在本文中,我们提出了一种统一的文本到结构生成框架,即UIE(Unified Information Extraction),该框架可以普遍建模不同的信息抽取任务,自适应地生成目标结构,并从不同的知识源中协同学习通用的信息抽取能力。具体而言,UIE通过一种结构化的抽取语言统一编码不同的抽取结构,通过基于模式的提示机制——结构模式指导器(Structural Schema Instructor)自适应地生成目标抽取结果,并通过大规模预训练的文本到结构模型捕捉通用的信息抽取能力。实验结果显示,UIE在4个信息抽取任务、13个数据集以及所有监督、低资源和少样本设置下均取得了最先进的性能,涵盖了广泛的实体、关系、事件和情感抽取任务及其统一。这些结果验证了UIE的有效性、通用性和迁移性。