2 个月前
结合读者评论的抽象文本摘要生成
Shen Gao; Xiuying Chen; Piji Li; Zhaochun Ren; Lidong Bing; Dongyan Zhao; Rui Yan

摘要
在神经抽象摘要生成领域,传统的基于序列到序列的模型通常会总结文档中与主要方面无关的错误内容。为了解决这一问题,我们提出了面向读者的抽象摘要生成任务,该任务利用读者评论帮助模型更好地总结主要方面。与传统抽象摘要生成任务不同,面向读者的摘要生成面临两个主要挑战:(1)评论是非正式且带有噪声的;(2)联合建模新闻文档和读者评论具有挑战性。为了应对这些挑战,我们设计了一种名为面向读者的摘要生成器(Reader-Aware Summary Generator, RASG)的对抗学习模型,该模型由四个组件构成:(1)基于序列到序列的摘要生成器;(2)捕捉读者关注方面的读者注意力模块;(3)建模生成摘要与读者关注方面之间语义差距的监督器;(4)为目标生成步骤提供目标的目标跟踪器。监督器和目标跟踪器以对抗的方式指导我们框架的训练。我们在大规模真实世界文本摘要数据集上进行了广泛的实验,结果表明RASG在自动评估指标和人工评价方面均达到了最先进的性能。实验结果还证明了我们框架中每个模块的有效性。我们发布了这一大规模数据集以供进一步研究。