17 天前

OpenIE6:用于开放信息抽取的迭代网格标注与协作分析

Keshav Kolluru, Vaibhav Adlakha, Samarth Aggarwal, Mausam, Soumen Chakrabarti
OpenIE6:用于开放信息抽取的迭代网格标注与协作分析
摘要

近期最先进的神经网络开放信息抽取(OpenIE)系统采用迭代方式生成抽取结果,需对部分输出结果进行多次编码,导致显著的计算开销。相比之下,基于序列标注的OpenIE方法虽然速度更快,但在抽取质量上表现较差。本文提出一种基于迭代标注的新型系统,成功弥合了速度与质量之间的权衡,在实现10倍加速的同时,达到了OpenIE任务的新技术水平。这一成果得益于一种创新的迭代网格标注(Iterative Grid Labeling, IGL)架构,该架构将OpenIE建模为二维网格标注任务。此外,我们在训练阶段引入覆盖性(软约束)机制,进一步提升了模型性能。进一步观察发现,当前表现最佳的OpenIE系统在处理并列结构(coordination structures)时存在明显不足。为此,我们的OpenIE系统集成了一种基于相同IGL架构的新式并列结构分析器。该分析器不仅显著增强了系统对复杂并列结构的处理能力,还在并列结构分析任务上创下新纪录,相较先前方法实现了12.3个百分点的F1值提升。综上所述,我们提出的OpenIE系统——OpenIE6,在F1指标上相较以往系统最高提升达4个百分点,同时具备显著更快的运行速度,成为当前OpenIE领域的最新标杆。