
要約
本研究では、長文文書に対する抽出型要約の問題を再検討する。我々は、人間が要約を抽出するプロセスが、以下の2段階に分かれる点に着目した。1)概略的な情報の検出を目的とした粗い読解段階、および2)要約の構成に必要な重要な文を選定するための慎重な読解段階である。この2段階のプロセスを模倣することで、抽出型要約のための新しいアプローチを提案する。本問題を文脈付きバンディット問題として定式化し、ポリシー勾配法を用いて解く。粗い読解段階では、畳み込みニューラルネットワーク(CNN)を用いて段落の要旨を符号化し、慎重な読解段階では、終了メカニズムを適応的に設計した意思決定ポリシーを導入する。CNNおよびDailyMailデータセットにおける実験結果から、提案手法が多様な長さの高品質な要約を生成でき、ROUGE指標において従来の最先端手法を顕著に上回ることが確認された。