
摘要
近年来,神经序列到序列模型在短文本摘要任务中取得了显著进展。然而,在文档摘要任务中,这些模型难以捕捉文档本身以及多句摘要的长期结构,导致信息丢失和重复问题。本文提出利用文档与多句摘要的结构信息,以提升文档摘要的性能。具体而言,我们在摘要生成过程中引入结构压缩(structural-compression)与结构覆盖(structural-coverage)正则化,以捕捉信息压缩与信息覆盖这两个文档摘要最关键的结构性特征。实验结果表明,所提出的结构正则化方法显著提升了摘要性能,使模型能够生成更具信息量且更简洁的摘要,从而在多项指标上显著优于当前最先进的神经抽象式摘要方法。