17 天前
结合上下文与全局特征的命名实体识别架构
Tran Thi Hong Hanh, Antoine Doucet, Nicolas Sidere, Jose G. Moreno, Senja Pollak

摘要
命名实体识别(Named Entity Recognition, NER)是一种信息抽取技术,旨在识别文档中的命名实体(如组织、地点等)并将其分类到预定义的类别中。准确识别这些实体短语在简化信息获取方面具有重要意义。然而,该任务仍具挑战性,因为命名实体具有多种形式且高度依赖上下文。尽管上下文信息可通过上下文特征进行建模,但现有模型往往难以充分捕捉实体之间的全局关系。本文提出将XLNet提供的上下文特征与图卷积网络(Graph Convolution Network, GCN)提取的全局特征相结合,以提升NER性能。在广泛使用的CoNLL 2003数据集上的实验结果表明,该方法显著提升了识别效果,性能达到与当前最先进(State-of-the-Art, SOTA)水平相当的水平。