11日前
GoSum:強化学習とグラフ構造化ディスコース状態を用いた長文ドキュメントの抽出型要約
Junyi Bian, Xiaodi Huang, Hong Zhou, Shanfeng Zhu

要約
長文ドキュメントからの要約抽出は、ドキュメントの構造的情報を用いた文の分類と見なすことができる。このような構造的情報を活用してドキュメントを要約する方法は、依然として困難な課題である。本論文では、長文論文要約のための新たな抽出型モデルであるGoSumを提案する。GoSumは、入力ドキュメントごとに異なる話法的レベルで異質なグラフを構築し、強化学習における文の状態を符号化する。グラフ内のエッジは、ドキュメントの話法的階層を反映し、セクション境界を越えた意味のずれ(semantic drift)を抑制する役割を果たす。我々は、科学論文要約を対象とした2つのデータセット(PubMedおよびarXiv)上でGoSumの性能を評価した。実験結果から、抽出型および要約型の強力なベースラインモデルと比較して、GoSumが最先端の性能を達成することが示された。また、アブレーションスタディにより、話法的情報を用いることでGoSumの性能が向上していることがさらに検証された。