17 天前

命名实体识别作为依存句法分析

Juntao Yu, Bernd Bohnet, Massimo Poesio
命名实体识别作为依存句法分析
摘要

命名实体识别(Named Entity Recognition, NER)是自然语言处理中的基础任务,旨在识别文本中表示实体引用的词元片段。以往的NER研究多集中于扁平实体(flat NER),忽略了实体引用可能具有嵌套结构的事实,例如 [Bank of [China]](Finkel 和 Manning,2009)。本文借鉴基于图的依存句法分析思想,采用双仿射模型(biaffine model,Dozat 和 Manning,2017)为模型提供对输入文本的全局视角。该模型对句子中所有起始与结束词元的组合进行打分,从而全面探索所有可能的文本片段,使模型能够更准确地预测命名实体。通过在8个语料库上的实验评估,我们验证了该模型在嵌套与扁平NER任务中均表现优异,并在所有语料上均达到当前最优(SoTA)性能,最高准确率提升达2.2个百分点。