
要約
抽出型要約モデルは、文レベルのラベルを必要としますが、多くの要約データセットでは通常、ドキュメントと要約のペアのみが提供されるため、これらのラベルはヒューリスティックな方法(例えば、ルールベースの手法)で作成されます。しかし、これらのラベルは最適ではない可能性があるため、本研究では文を潜在変数として扱う潜在変数抽出型モデルを提案します。活性化された潜在変数を持つ文がゴールド要約の推論に使用されます。学習時には、損失がゴールド要約から直接計算されます。CNN/Dailymail データセットでの実験結果によると、ヒューリスティックに近似されたラベルで学習した強力な抽出型基準モデルよりも当該モデルの性能が向上しており、最近の複数のモデルと競合する性能を示しています。