
要約
多くの質問応答(QA)タスクでは、答えの算出方法について弱い教師信号しか提供されていない。たとえば、TriviaQAの答えは、支援文書中に複数回登場する可能性のあるエンティティであり、DROPの答えは参照テキスト内の数値からさまざまな異なる式を導出することで算出可能である。本論文では、このようなタスクを、事前に計算されたタスク固有の「解候補」(例えば、異なる参照表現や式)の集合を含む離散的潜在変数学習問題に変換できる可能性を示す。この集合には正しい答えが一つ含まれている。その後、各更新ステップにおいて最も可能性の高い解に対する勾配を計算するハードEM学習スキームを提案する。この手法は単純であるにもかかわらず、6つのQAタスクにおいて従来手法を著しく上回り、絶対的な性能向上として2~10%の改善を達成し、そのうち5つのタスクで最先端の性能を達成した。マージナル尤度の最大化ではなくハード更新を採用することが、これらの成果の鍵である。詳細な定性的分析を通じて、モデルが唯一の正解を見つけるように促すことが、このアプローチの有効性を裏付けていることを示した。