
摘要
缺乏词边界信息一直被视为制约中文命名实体识别(NER)系统实现高性能的主要障碍之一。幸运的是,自动构建的词典包含了丰富的词边界信息与词汇语义信息。然而,在将词汇知识融入中文NER任务时,仍面临两大挑战:一是自匹配词汇词的处理,二是最近邻上下文词汇词的利用。为此,我们提出一种协作图网络(Collaborative Graph Network)来解决上述问题。在多个数据集上的实验结果表明,所提模型不仅显著超越了当前最优(SOTA)水平,而且在推理速度上比SOTA模型快六至十五倍。
缺乏词边界信息一直被视为制约中文命名实体识别(NER)系统实现高性能的主要障碍之一。幸运的是,自动构建的词典包含了丰富的词边界信息与词汇语义信息。然而,在将词汇知识融入中文NER任务时,仍面临两大挑战:一是自匹配词汇词的处理,二是最近邻上下文词汇词的利用。为此,我们提出一种协作图网络(Collaborative Graph Network)来解决上述问题。在多个数据集上的实验结果表明,所提模型不仅显著超越了当前最优(SOTA)水平,而且在推理速度上比SOTA模型快六至十五倍。