11 天前

定位与标注:一种两阶段嵌套命名实体识别标识器

Yongliang Shen, Xinyin Ma, Zeqi Tan, Shuai Zhang, Wen Wang, Weiming Lu
定位与标注:一种两阶段嵌套命名实体识别标识器
摘要

命名实体识别(Named Entity Recognition, NER)是自然语言处理领域中一项被广泛研究的任务。传统NER研究仅关注平铺式实体(flat entities),忽略了嵌套实体(nested entities)的存在。基于跨度(span-based)的方法将实体识别建模为跨度分类任务,尽管这类方法在理论上具备处理嵌套NER的能力,但仍面临计算成本高、忽略边界信息、对部分匹配跨度的利用不足以及长实体识别困难等问题。为解决上述挑战,本文提出一种两阶段实体识别框架。首先,通过在初始跨度(seed spans)上进行筛选与边界回归,生成候选跨度以定位实体;随后,对边界调整后的候选跨度进行类别标注。该方法在训练过程中有效利用了实体的边界信息以及部分匹配的跨度。借助边界回归机制,理论上可覆盖任意长度的实体,显著提升了对长实体的识别能力。此外,第一阶段可过滤掉大量低质量的初始跨度,从而降低推理阶段的时间复杂度。在多个嵌套NER数据集上的实验结果表明,所提出的模型在性能上超越了以往最先进的方法。

定位与标注:一种两阶段嵌套命名实体识别标识器 | 最新论文 | HyperAI超神经