
要約
本研究では、指定された長さ制約内において、カバレッジと文の自然さの組み合わせを最大化することを目的とした、非教師あり要約生成の新しいアプローチを提示する。本手法は、元の文書から重要な用語をマスクし、生成中の要約を用いてカバレッジモデルがそれらを補完する必要があることにより、要約に重要な用語を含むことを促進する新しい方法を導入している。さらに、このカバレッジモデルと文の自然さを評価するモデルを組み合わせた、新たな非教師あり学習手順を提案し、要約の生成とスコアリングを実現している。一般的なニュース要約データセット上で実験した結果、従来の非教師あり手法よりもR-1スコアで2ポイント以上優れており、競合する教師あり手法の性能に近づいた。本モデルは、従来手法と比べてコピーされる文章の長さを約2倍短くしつつ、より高い抽象度を達成し、教師信号なしに文の圧縮および統合を学習することが可能である。