
要約
文の単純化は、分割、削除、言い換えなどの操作を基に、読みやすさと理解しやすさを向上させることが目的です。しかし、有効な単純化された文は、入力文から論理的に導かれるべきです。本研究では、まず強力なポインターコピー機構に基づくシーケンス・ツー・シーケンスの文単純化モデルを提示します。次に、関連する補助タスクである意味包含(entailment)生成と言い換え生成とのマルチタスク学習を通じて、その意味包含と言い換え能力を向上させます。さらに、各補助タスクが文単純化モデルの異なる(上位対下位)レベルの層を共有する新しい「多段階」レイヤードソフトシェアリング手法を提案します。これはタスクの意味的性質と語彙構文的性質に応じています。また、マルチタスク学習中にタスク間で効果的に切り替える方法を動的に学習する新しいマルチアームバンディットに基づく訓練手法も紹介します。複数の人気データセットでの実験結果は、当モデルがSARIおよびFKGL自動評価指標において競合する単純化システムを上回り、人間評価でも優れていることを示しています。さらに、代替の層共有手法やソフトシェアリング対ハードシェアリング、動的なマルチアームバンディットサンプリング手法についての詳細な解析を行い、当モデルが学習した意味包含と言い換えスキルについても考察しています。