2 个月前
BoningKnife:基于先验边界知识的联合实体提及检测与分类方法用于嵌套命名实体识别
Huiqiang Jiang; Guoxin Wang; Weile Chen; Chengxi Zhang; Börje F. Karlsson

摘要
命名实体识别(NER)是自然语言处理中的一个关键任务,但大多数方法仅针对扁平实体,忽略了在许多场景中常见的嵌套结构。现有的大多数嵌套NER方法遍历所有子序列,这不仅成本高昂且效率低下,而且未能充分考虑对嵌套实体至关重要的边界知识。本文提出了一种通过先验边界知识(BoningKnife)进行联合实体提及检测和类型分类的模型,以更好地处理嵌套NER的提取和识别任务。BoningKnife由两个模块组成:MentionTagger和TypeClassifier。MentionTagger不仅利用了实体的起始/结束位置,还更好地利用了边界知识来改进对嵌套层次和较长跨度的处理,并生成高质量的提及候选。TypeClassifier采用两级注意力机制来解耦不同嵌套层次的表示,并更好地区分实体类型。我们通过共享一个共同表示和一个新的双信息注意力层对这两个模块进行联合训练,从而提高了表示对实体相关信息的关注度。在不同数据集上的实验表明,我们的方法优于以往的最先进方法,在ACE2004、ACE2005和NNE数据集上分别达到了86.41、85.46和94.2的F1分数。