2ヶ月前
Multi-News: 大規模な多文書要約データセットと抽象的階層モデル
Alexander R. Fabbri; Irene Li; Tianwei She; Suyi Li; Dragomir R. Radev

要約
複数のニュース記事から自動的に要約を生成することは、オンライン出版物が急速に増加する中で価値あるツールとなっています。単一文書要約(Single Document Summarization: SDS)システムは、大規模なデータセットの利用可能性により、ニューラルエンコーダー-デコーダーモデルの進歩から恩恵を受けました。しかし、ニュース記事の多文書要約(Multi-Document Summarization: MDS)は、数百例程度のデータセットに限定されていました。本論文では、初めての大規模MDSニュースデータセットであるMulti-Newsを紹介します。さらに、従来の抽出型要約モデルと標準的なSDSモデルを組み合わせたエンドツーエンドモデルを提案し、MDSデータセットでの競争力のある結果を達成しています。私たちはMulti-News上でいくつかの手法をベンチマーク評価し、データとコードを公開することで、多文書設定における要約技術の進歩に貢献することを目指しています。