
要約
本稿では、長文文書に対する新たなニューラル単ドキュメント抽出要約モデルを提案する。本モデルは、文書全体のグローバルな文脈と、現在のトピック内のローカルな文脈の両方を統合する特徴を持つ。我々は、科学論文データセットであるPubmedおよびarXivの2つのデータセット上で本モデルを評価した結果、従来の抽出型および要約型モデルと比較して、ROUGE-1、ROUGE-2およびMETEORスコアにおいて優れた性能を示した。また、本研究の目的に合致する形で、モデルの効果が文書の長さが増すにつれて顕著に強化されることが示された。驚くべきことに、アブレーションスタディの結果、長文ドキュメントにおいても、本モデルの利点はローカルな文脈をモデル化することに起因していることが明らかになった。