2 个月前

基于词和实体注意力机制改进远监督关系抽取

Sharmistha Jat; Siddhesh Khandelwal; Partha Talukdar
基于词和实体注意力机制改进远监督关系抽取
摘要

关系抽取是指对给定句子中两个实体之间的关系进行分类的问题。远监督(Distant Supervision, DS)是一种在初始监督有限的情况下开发关系抽取器的常用技术。我们注意到,在远监督关系抽取设置中,大多数句子都非常长,可能通过词注意力机制获得更好的句子表示。本文的贡献有三个方面:首先,我们提出了两种新的词注意力模型用于远监督关系抽取:(1)基于双向门控循环单元(Bi-directional Gated Recurrent Unit, Bi-GRU)的词注意力模型(BGWA),(2)以实体为中心的注意力模型(Entity-centric Attention, EA),以及(3)一种组合模型,该模型通过加权投票方法结合多个互补模型,以提高关系抽取的效果。其次,我们引入了GDS,一个新的远监督关系抽取数据集。GDS去除了所有先前远监督基准数据集中存在的测试数据噪声,使得可信的自动评估成为可能。最后,通过在多个真实世界数据集上的广泛实验,我们展示了所提出方法的有效性。

基于词和实体注意力机制改进远监督关系抽取 | 最新论文 | HyperAI超神经