
摘要
在自然语言处理领域,许多实体内部往往包含其他实体,即存在嵌套结构。然而,现有的大多数命名实体识别(NER)方法仅处理扁平化实体,忽略了嵌套实体的识别问题。为此,本文提出一种边界感知的神经网络模型,用于解决嵌套命名实体识别任务。该模型通过利用实体边界信息来预测实体类别标签。具体而言,模型首先通过序列标注方法精确检测实体边界,进而基于与边界相关的信息区域进行类别预测,这一机制不仅降低了计算开销,还有效缓解了多层序列标注模型中常见的误差传播问题。此外,本文引入多任务学习框架,以捕捉实体边界与其类别标签之间的依赖关系,从而提升实体识别的性能。我们在 GENIA 数据集上进行了实验,结果表明,所提出的模型在各项指标上均优于现有的先进方法。