11 天前

SLK-NER:利用二阶词典知识进行中文命名实体识别

Dou Hu, Lingwei Wei
SLK-NER:利用二阶词典知识进行中文命名实体识别
摘要

尽管基于字的模型结合词典知识在中文命名实体识别(NER)任务中已取得令人瞩目的成果,但某些词典词汇因错误匹配而引入了错误信息。现有研究提出了多种融合词典知识的策略,然而这些方法大多仅利用了一阶词典知识,所提供的词信息有限,且仍面临词边界匹配冲突的挑战;另一些方法则通过图结构探索高阶词典知识,但引入的负向词汇可能干扰实体识别。为缓解上述局限,本文提出一种新视角:挖掘句子中每个字的二阶词典知识(Second-Order Lexicon Knowledge, SLK),以提供更丰富的词汇信息,包括语义特征与词边界特征。基于此,我们提出一种基于SLK的新型模型,并设计了一种创新的词典知识融合策略。该模型能够借助全局上下文,更充分地挖掘具有区分性的词汇信息。在三个公开数据集上的实验结果验证了SLK的有效性,所提模型在性能上显著优于当前最先进的对比方法。

SLK-NER:利用二阶词典知识进行中文命名实体识别 | 最新论文 | HyperAI超神经