
要約
本論文では、ウィキペディアを唯一の知識源として使用してオープンドメインの質問応答に取り組む方法を提案する:任意の事実質問の答えは、ウィキペディア記事内のテキスト範囲である。この大規模な機械読解タスクは、文書検索(関連記事を見つけること)とテキストの機械理解(その記事から答えの範囲を特定すること)の課題を組み合わせている。我々のアプローチは、ビグラムハッシングとTF-IDFマッチングに基づく検索コンポーネントと、ウィキペディアの段落内で答えを検出するために訓練された多層再帰ニューラルネットワークモデルを組み合わせている。既存の複数のQAデータセットに対する実験結果から、(1) 両モジュールが既存の対応技術に対して非常に競争力があり、(2) 関連監督を使用したマルチタスク学習がこの困難なタスクにおける効果的な完全システムであることが示されている。