
摘要
我们提出了一种用于命名实体识别(NER)的神经重排序系统。基本思路是利用循环神经网络模型学习涉及命名实体提及的句子级模式。具体而言,对于由基础NER模型生成的输出句子,我们将所有实体提及(如“巴拉克·奥巴马”)替换为其对应的实体类型(如“人名”)。这样得到的句子模式包含了直接的输出信息,但没有特定的命名实体,因此稀疏度较低。例如,“人名出生于地名”可以是一个这样的模式。为了学习这些句子的深层表示以进行重排序,我们采用了LSTM和CNN结构。实验结果表明,我们的系统在两个不同的基准模型上显著提高了NER的准确性,并在标准基准测试中取得了最佳报告结果。