2ヶ月前
R$^3$: 強化されたリーダー-ランカーのオープンドメイン質問応答システム
Shuohang Wang; Mo Yu; Xiaoxiao Guo; Zhiguo Wang; Tim Klinger; Wei Zhang; Shiyu Chang; Gerald Tesauro; Bowen Zhou; Jing Jiang

要約
近年、研究者たちはニューラルネットワーク手法を質問応答(QA)に適用することで、著しい成功を収めています。これらの手法は、SQuAD (Rajpurkarら, 2016) データセットなどの単純な閉域設定で最先端の成果を達成しています。SQuADデータセットでは、事前に選択された文章が提供され、その中から特定の質問に対する答えを抽出します。最近では、研究者たちは開域QAに取り組み始めています。開域QAでは、モデルには質問と大規模なコーパス(例:ウィキペディア)へのアクセスが与えられ、事前に選択された文章ではなく、関連する文章を検索し、それを読み解いて質問に対する答えを生成する必要があります (Chenら, 2017a)。この設定はより複雑であり、情報検索部品による大規模な関連文章の検索と、文章を「読む」ことで答えを生成するリーディングコンプリ헨ションモデルの組み合わせが必要です。開域設定での性能は閉域設定に比べて大幅に遅れています。本論文では、2つのアルゴリズム革新に基づく新しい開域QAシステムであるReinforced Ranker-Reader ($R^3$) を提案します。まず、与えられた質問に対する正解の生成確率に基づいて検索された文章をランク付けするRanker部品を持つ新しい開域QAパイプラインを提案します。次に、強化学習に基づいてRankerと答え生成用のReaderモデルを共同で学習させる新しい方法を提案します。我々は実験結果を通じて、本手法が複数の開域QAデータセットにおいて現行の最先端手法よりも有意に性能向上することを示しています。