2ヶ月前
MemSum: 長文の抽出的要約を生成するための多段階エピソード型マルコフ決定過程の利用
Nianlong Gu; Elliott Ash; Richard H.R. Hahnloser

要約
私たちはMemSum(Multi-step Episodic Markov decision process extractive SUMmarizer)を紹介します。これは、強化学習に基づく抽出型要約生成システムであり、各ステップで現在の抽出履歴に関する情報を追加することで豊かになります。MemSumが反復的に文を選択して要約に組み込む際には、このタスクにおいて人間が直感的にも使用する広範な情報セットが考慮されます:1) 文のテキスト内容、2) ドキュメント全体のグローバルなテキストコンテクスト、3) 既に抽出された文の集合からなる抽出履歴です。軽量なアーキテクチャを持つMemSumは、PubMed、arXiv、およびGovReportから取得した長文の要約において最先端のテストセット性能(ROUGE)を達成しています。削除実験により、局所情報、全局情報、および履歴情報の重要性が示されています。ヒューマン評価では、MemSumが抽出履歴に意識的であることで生成される要約の高品質と低冗長性が確認されました。