SimCLS : Un cadre simple pour l'apprentissage contrastif de résumé abstrait

Dans cet article, nous présentons un cadre conceptuellement simple mais empiriquement puissant pour la synthèse abstraite, appelé SimCLS, qui permet de combler l’écart entre l’objectif d’apprentissage et les métriques d’évaluation découlant du cadre d’apprentissage séquentiel dominé actuellement, en reformulant la génération de texte comme un problème d’évaluation sans référence (c’est-à-dire une estimation de qualité), aidé par un apprentissage contrastif. Les résultats expérimentaux montrent qu’avec une légère modification des systèmes actuels les plus performants, SimCLS permet d’améliorer significativement les performances des modèles existants. En particulier, une amélioration absolue de 2,51 par rapport à BART et de 2,50 par rapport à PEGASUS en ROUGE-1 sur le jeu de données CNN/DailyMail, portant ainsi les performances de l’état de l’art à un nouveau niveau. Nous avons rendu open-source notre code et nos résultats : https://github.com/yixinL7/SimCLS. Les résultats des modèles proposés ont été déployés sur la plateforme ExplainaBoard, permettant aux chercheurs d’analyser nos systèmes de manière plus fine.