2 个月前
神经关系抽取:句内与跨句边界
Pankaj Gupta; Subburam Rajaram; Hinrich Schütze; Bernt Andrassy; Thomas Runkler

摘要
以往的关系抽取研究主要集中在单个句子内实体对之间的二元关系。近年来,自然语言处理(NLP)领域对跨越多个句子的实体对关系抽取产生了浓厚兴趣。在本文中,我们提出了一种新的架构来解决这一任务:跨句依赖神经网络(iDepNN)。iDepNN通过递归神经网络和循环神经网络建模最短和扩展的依赖路径,以提取句内(intra-)和句间(inter-)边界的关系。与支持向量机(SVM)和神经网络基线相比,iDepNN在处理跨越句子的关系时对假阳性具有更强的鲁棒性。我们在四个来自新闻专线(MUC6)和医学(BioNLP共享任务)领域的数据集上评估了我们的模型,这些模型达到了当前最佳性能,并在跨句关系的精确率和召回率之间表现出更好的平衡。我们在2016年BioNLP共享任务中超过了11支参赛队伍,并在F1分数上比获胜团队提高了5.2%(0.587对比0.558)。此外,我们还发布了MUC6的跨句注释。