13 天前

系统性探索长文档摘要中的冗余缩减

Wen Xiao, Giuseppe Carenini
系统性探索长文档摘要中的冗余缩减
摘要

我们对大规模摘要数据集的分析表明,在摘要长文档时,冗余问题极为严重。然而,冗余减少在神经网络摘要任务中尚未得到充分研究。在本工作中,我们系统地探索并比较了处理长文档摘要中冗余问题的多种方法。具体而言,我们根据冗余被考虑的时间和方式,将现有方法进行了分类。在此分类框架下,我们提出了三种新的方法,能够以一种通用且灵活的方式平衡非冗余性与重要性。在一系列实验中,我们的方法在两个科学论文数据集(Pubmed 和 arXiv)上均取得了当前最优的 ROUGE 得分,同时显著降低了摘要中的冗余程度。

系统性探索长文档摘要中的冗余缩减 | 最新论文 | HyperAI超神经