要約
複数文書要約において、関連性があり多様な情報を効果的に伝える能力は極めて重要であるが、従来のニューラルseq-to-seqモデルは出力が重複しやすく、重要な情報を正しく網羅できないという課題を抱えている。本研究では、関連性と多様性に重点を置く注目メカニズムを提案する。本手法では、要約対象のコンテンツ単位の集合上に定義された行列式点過程(Determinantal Point Processes: DPPs)に基づく(比例する)確率を用いて注目重みを計算する。DPPは抽出型要約において既に成功裏に利用されてきたが、本研究では、ニューラル抽象型要約における関連性と多様性を兼ね備えたコンテンツ選択にDPPを活用する。さらに、CNNからLSTM、Transformerに至る多様なseq-to-seqアーキテクチャに、DPPに基づく注目メカニズムを統合した。実験評価の結果、本手法はマルチニュースデータセットにおいて、従来の最先端技術と同等の性能を一貫して達成し、要約品質の向上を示した。