Command Palette
Search for a command to run...
BanditSum: 文脈バンディットとしての抽出的要約
BanditSum: 文脈バンディットとしての抽出的要約
Yue Dong; Yikang Shen; Eric Crawford; Herke van Hoof; Jackie Chi Kit Cheung
概要
本研究では、ヒューリスティックに生成された抽出ラベルを使用せずに、単一文書の抽出要約を行うニューラルネットワークの訓練方法を提案します。当該手法をBanditSumと呼びます。BanditSumは、抽出要約をコンテキストバンドイット(CB)問題として扱います。ここで、モデルは要約すべき文書(コンテキスト)を受け取り、要約に含めるべき文の系列を選択します(アクション)。モデルがROUGEスコアを最大化する文の系列を選択するように訓練するために、方策勾配強化学習アルゴリズムを使用しています。一連の実験を通じて、BanditSumが抽出要約における最先端手法よりも優れたまたは同等のROUGEスコアを達成できることを示し、競合する手法よりも著しく少ない更新ステップで収束することも確認しました。さらに、 BandsitSumがソースドキュメントの後半に良い要約文が現れる場合でも、競合する手法よりも著しく優れた性能を発揮することを実証的に示しています。