7 天前

通过外部上下文检索与协同学习提升命名实体识别

Xinyu Wang, Yong Jiang, Nguyen Bach, Tao Wang, Zhongqiang Huang, Fei Huang, Kewei Tu
通过外部上下文检索与协同学习提升命名实体识别
摘要

近年来,命名实体识别(Named Entity Recognition, NER)领域的进展表明,利用文档级上下文能够显著提升模型性能。然而,在许多实际应用场景中,此类上下文信息往往不可用。本文提出一种新方法:通过以原始句子作为查询,利用搜索引擎检索并筛选出一组语义相关的外部文本,从而为该句子构建外部上下文。实验结果表明,基于检索所得外部上下文与原句拼接形成的“检索式输入视图”所计算出的上下文表示,相较于仅依赖原句的原始输入视图,能够显著提升模型性能。此外,我们进一步提出一种协同学习(Cooperative Learning)训练方法,通过促使两个输入视图(原始输入视图与检索式输入视图)生成相似的上下文表示或输出标签分布,进一步优化模型表现。在涵盖5个不同领域的8个NER数据集上的实验结果表明,所提方法达到了新的最先进(state-of-the-art)性能水平。