Command Palette
Search for a command to run...
テキスト要約における抽象化の向上
テキスト要約における抽象化の向上
Wojciech Kryściński Romain Paulus Caiming Xiong Richard Socher
概要
摘出的な文章要約は、長い文章ドキュメントを元のドキュメントの最も重要な事実を含む人間が読みやすい形式に短縮することを目指しています。しかし、既存の手法では、ソースドキュメントに現れない新しい表現による抽象度が低いという問題があります。本研究では、生成された要約の抽象度を向上させるための2つの技術を提案します。第一に、デコーダーを、ソースドキュメントの関連部分を検索するコンテキストネットワークと、言語生成に関する事前知識を取り入れた事前学習済み言語モデルに分解します。第二に、新しい表現の生成を促進するために直接方策学習を通じて最適化される新規性指標を提案します。当該モデルはROUGEスコアおよび人間評価によって決定される最先端モデルと同等の結果を得つつ、n-グラム重複率によって測定される抽象度が著しく高いことを達成しました。