
摘要
一个高质量的抽象式摘要不仅应准确提取源文本中的关键信息,还应倾向于生成新的概念性词汇以表达具体细节。受流行指针生成序列到序列模型的启发,本文提出了一种概念指针网络(concept pointer network),以提升抽象式摘要在上述方面的表现。该网络利用基于知识的、上下文感知的概念化方法,构建了一个扩展的候选概念集合;随后,模型结合该概念集合与原始源文本,共同确定最恰当的输出选择。这种联合机制能够生成蕴含更高级语义概念的抽象式摘要。此外,该训练模型通过一种新颖的远程监督学习方法进行优化,该方法以参考摘要和测试集为指导,能够自适应不同数据集。总体而言,该方法在DUC-2004和Gigaword两个数据集上均显著优于多个当前最先进的模型,统计结果具有显著性。人工评估也进一步验证了该框架所生成摘要在抽象能力方面的高质量表现。