2 个月前
使用序列到序列RNN及更高级方法的抽象文本摘要生成
Ramesh Nallapati; Bowen Zhou; Cicero Nogueira dos santos; Caglar Gulcehre; Bing Xiang

摘要
在本研究中,我们使用注意力机制编码器-解码器循环神经网络(Attentional Encoder-Decoder Recurrent Neural Networks)对抽象文本摘要进行建模,并展示了该模型在两个不同语料库上达到了最先进的性能。我们提出了一系列新颖的模型,旨在解决基本架构未能充分建模的摘要生成中的关键问题,如关键词建模、捕捉句子到单词的层次结构以及生成训练时罕见或未见过的单词。我们的研究表明,许多所提出的模型进一步提升了性能。此外,我们还提出了一个新的多句摘要数据集,并为后续研究建立了性能基准。