17 天前

InferNER:一种利用句子级信息的注意力模型,用于微博中的命名实体识别

{Axel-Cyrille Ngonga Ngomo, Diego Esteves, Ayesha Amin, Moemmur Shahzad}
摘要

我们研究了在用户生成文本(如社交媒体帖子)中进行命名实体识别(Named Entity Recognition, NER)的问题。由于此类数据长度受限且语法连贯性较差,该任务面临显著挑战。当前最先进的方法通常依赖外部资源(如地名词典,gazetteers)以缓解上述限制。本文提出一种神经网络模型,在不依赖地名词典或其他类似外部信息源的情况下,仍能超越现有最先进水平。该方法融合了词级、字级及句子级信息,以提升短文本中的命名实体识别性能。此外,社交媒体帖子(如推文)常配有相关图像,这些图像可能提供有助于理解文本的辅助上下文信息。因此,我们进一步引入视觉信息,并设计了一种注意力机制,分别计算文本内容与文本相关视觉上下文的注意力权重概率。实验结果表明,该模型在多个NER数据集上均优于当前最先进方法:在WNUT 2016和WNUT 2017数据集上,分别取得了53.48%和50.52%的F1分数;在多模态数据集上,结合多模态信息的模型更取得了74%的F1分数,显著超越当前最先进水平。进一步评估还表明,该模型在新闻语料(newswire)数据上同样表现优于现有最先进方法,验证了其在多种命名实体识别任务中的广泛适用性与优越性能。