
摘要
本文提出了一种新型的抽象式文档摘要模型——分层BART(Hie-BART),该模型在BART架构中引入了对文档层次结构(即句子-词级结构)的建模能力。尽管现有的BART模型在文档摘要任务中已达到当前最优性能,但其缺乏句级信息与词级信息之间的交互机制。在机器翻译任务中,通过引入多粒度自注意力机制(Multi-Granularity Self-Attention, MG-SA),神经机器翻译模型的性能得到了显著提升,该机制能够有效捕捉词语与短语之间的关联关系。受此启发,本文提出的Hie-BART模型将MG-SA机制引入BART的编码器中,以更好地建模句子与词之间的层次结构。在CNN/Daily Mail数据集上的实验结果表明,所提出的Hie-BART模型优于多个强基准模型,并相较非层次化的BART模型在ROUGE-L指标上提升了0.23分。