
要約
最近のニューラルシーケンス・ツー・シーケンスモデルは、短文要約において顕著な進展を遂げている。しかし、ドキュメント要約においては、ドキュメントおよび複数文から構成される要約の長期的な構造を捉えられず、情報の損失や重複が生じるという課題がある。本論文では、ドキュメントおよび複数文要約の構造的情報を活用することで、ドキュメント要約性能の向上を図る手法を提案する。具体的には、要約生成プロセスに構造的圧縮(structural-compression)および構造的カバレッジ(structural-coverage)の正則化を導入し、ドキュメント要約における最も重要な2つの構造的特性である情報圧縮性と情報カバレッジ性を捉えることを目的とする。実験結果から、構造的正則化がドキュメント要約性能を顕著に向上させ、より情報豊かで簡潔な要約を生成可能であることが示された。その結果、本モデルは最先端のニューラル抽象的要約手法を大きく上回る性能を達成した。