11 天前

FGN:用于中文命名实体识别的融合字形网络

Zhenyu Xuan, Rui Bao, Shengyi Jiang
FGN:用于中文命名实体识别的融合字形网络
摘要

中文命名实体识别(Chinese NER)是一项具有挑战性的任务。由于汉字作为表意文字,其内部蕴含着丰富的字形(glyph)信息,而这些信息在以往的研究中往往被忽视。本文提出了一种名为Fusion Glyph Network(FGN)的新型神经网络架构,用于提升中文命名实体识别性能。该方法不仅引入了字形信息,还通过融合机制引入了字符间的交互信息。FGN的主要创新点包括:(1)提出一种新颖的CNN结构——CGS-CNN(Character Glyph Structure CNN),用于同时捕捉相邻字符之间的字形特征及其相互作用信息;(2)设计了一种结合滑动窗口与Slice-Attention机制的方法,实现对单个字符的BERT表示与字形表示的有效融合,从而挖掘上下文与字形之间的潜在交互知识。在四个公开的中文NER数据集上的实验结果表明,采用LSTM-CRF作为标注器的FGN模型达到了当前最先进的性能。此外,本文还进行了多组消融实验,系统分析了FGN中各组件及不同设置对最终效果的影响。

FGN:用于中文命名实体识别的融合字形网络 | 最新论文 | HyperAI超神经