
摘要
在本工作中,我们重新审视了长文档抽取式文本摘要问题。我们观察到,人类进行摘要提取的过程可划分为两个阶段:第一阶段为粗读阶段,用于寻找概要性信息;第二阶段为精读阶段,用于筛选关键句子以形成最终摘要。受此启发,我们提出了一种新颖的抽取式摘要方法,模拟上述两阶段过程。我们将该问题建模为上下文相关多臂赌博机(contextual-bandit)问题,并采用策略梯度方法进行求解。在粗读阶段,我们使用卷积神经网络对段落主旨进行编码;在精读阶段,则设计了一种具备自适应终止机制的决策策略,以实现关键句子的精准选择。在CNN与DailyMail数据集上的实验结果表明,所提出的方法能够生成高质量、长度可变的摘要,在ROUGE指标上显著优于当前最先进的抽取式摘要方法。