2 个月前

基于双向LSTM-CNNs的命名实体识别

Jason P.C. Chiu; Eric Nichols
基于双向LSTM-CNNs的命名实体识别
摘要

命名实体识别是一项具有挑战性的任务,传统上需要大量的知识,包括特征工程和词典,才能实现高性能。本文介绍了一种新颖的神经网络架构,该架构通过混合双向LSTM(长短期记忆)和CNN(卷积神经网络)自动检测词级和字符级特征,从而消除了大部分特征工程的需求。我们还提出了一种在神经网络中编码部分词典匹配的新方法,并将其与现有方法进行了比较。广泛的评估表明,仅使用分词文本和公开可用的词嵌入,我们的系统在CoNLL-2003数据集上的表现具有竞争力,并且在OntoNotes 5.0数据集上超越了先前报告的最佳性能,提高了2.13个F1分数点。通过使用从公开资源构建的两个词典,我们在CoNLL-2003数据集上达到了91.62的F1分数,在OntoNotes数据集上达到了86.28的F1分数,超过了那些采用大量特征工程、专有词典和丰富实体链接信息的系统。