
摘要
我们介绍了一种基于强化学习的抽取式摘要生成器MemSum(多步情景马尔可夫决策过程抽取式摘要生成器),该生成器在每一步中都会结合当前提取历史的信息进行丰富。当MemSum迭代选择句子加入摘要时,它会考虑一个广泛的信息集,这些信息集在人类执行此任务时也会直观地被使用:1)句子的内容,2)文档其余部分的全局上下文,以及3)由已提取句子组成的提取历史。通过轻量级架构,MemSum在从PubMed、arXiv和GovReport获取的长文档摘要生成中取得了最先进的测试集性能(ROUGE)。消融研究表明了局部、全局和历史信息的重要性。人工评估确认了生成摘要的高质量和低冗余性,这得益于MemSum对提取历史的感知能力。