
要約
本稿では、要約生成のための概念的に単純でありながら実証的に強力なフレームワーク、SimCLSを提案する。この手法は、現在主流であるシーケンス・トゥ・シーケンス学習フレームワークにおける学習目的と評価指標の乖離を解消するもので、対照学習(contrastive learning)を活用して、参照文を必要としない評価問題(すなわち、品質推定)としてテキスト生成を定式化することで実現している。実験結果から、既存のトップスコアシステムにわずかな修正を加えるだけで、SimCLSは既存の最先端モデルの性能を大幅に向上させることを示した。特に、CNN/DailyMailデータセットにおけるROUGE-1スコアにおいて、BARTに対して2.51の絶対的な向上、PEGASUSに対して2.50の向上を達成し、要約分野の最先端性能を新たな水準に引き上げた。本研究のコードおよび実験結果は公開しており、GitHubにて公開されている:https://github.com/yixinL7/SimCLS。また、提案するモデルの結果はExplainaBoardプラットフォームにデプロイされており、研究者が本システムの動作をより詳細かつ細粒度に理解できる環境を提供している。