
摘要
本文提出了一种概念简洁但实证效果显著的抽象摘要框架——SimCLS。该框架通过将文本生成任务重新定义为无需参考文本的评估问题(即质量估计),并借助对比学习(contrastive learning)技术,有效弥合了当前主流序列到序列学习范式中学习目标与评估指标之间的鸿沟。实验结果表明,仅需对现有顶尖模型进行微小调整,SimCLS即可显著提升其性能。在CNN/DailyMail数据集上,相较于BART模型,ROUGE-1指标提升达2.51个百分点;相较于PEGASUS模型,提升亦达2.50个百分点,将当前摘要任务的最先进水平推至全新高度。我们已开源全部代码与实验结果:https://github.com/yixinL7/SimCLS。所提出的模型结果已部署于ExplainaBoard平台,使研究者能够以更细粒度的方式深入理解系统行为与性能表现。