
摘要
嵌套在较长实体中的实体被称为嵌套实体(nested entities)。大多数命名实体识别(NER)系统仅处理扁平实体,忽略其中的嵌套实体,因而无法充分捕捉文本中更细粒度的语义信息。为解决这一问题,本文提出一种新型神经网络模型,通过动态堆叠扁平NER层来识别嵌套实体。每一层扁平NER模型均基于当前最先进的扁平NER架构,利用双向长短期记忆网络(bidirectional LSTM)捕捉序列上下文表示,并将其输入级联条件随机场(CRF)层进行标注。本文模型将当前扁平NER层中LSTM层的输出结果进行融合,构建被识别实体的新表示,并将其输入下一层次的扁平NER层。该机制使模型能够以“由内而外”的方式,充分利用内层实体所编码的信息,有效识别外层实体。模型动态堆叠扁平NER层,直至无法再提取出新的外层实体为止。大量实验评估表明,该动态模型在嵌套NER任务上显著优于现有基于特征的先进系统,在GENIA和ACE2005数据集上的F-score分别达到74.7%和72.2%。