18 天前

位置感知注意力与监督数据提升槽位填充

{Victor Zhong, Gabor Angeli, Danqi Chen, Yuhao Zhang, Christopher D. Manning}
位置感知注意力与监督数据提升槽位填充
摘要

以“知识图谱”形式组织的关联知识在诸多应用中具有重要意义。然而,从文档中自动提取事实并填充知识库的能力提升极为缓慢。本文同时解决了制约先前研究发展的两个关键问题。首先,我们提出了一种新型高效模型,该模型将LSTM序列模型与一种更具实体位置感知能力的注意力机制相结合,更适用于关系抽取任务。随后,我们构建了TACRED数据集——一个通过众包获取的大型监督关系抽取数据集(包含119,474个样本),其目标是针对TAC KBP任务中的关系类型。结合更高质量的监督数据与更合适的高容量模型,显著提升了关系抽取的性能。当该模型在新数据集上训练后,替代原有TAC KBP 2015任务中最佳槽位填充系统的组件时,其F1得分从22.2%显著提升至26.7%。