
要約
以前の機械読解(MC)データセットは、エンドツーエンドの深層学習モデルを訓練するのに十分な規模が小さかったか、または現在のMC技術の能力を評価するのに十分に難しくなかった。新しく公開されたSQuADデータセットはこれらの制限を緩和し、より現実的なMCモデルを開発する機会を与えている。このデータセットに基づいて、私たちはMulti-Perspective Context Matching(MPCM)モデルを提案する。これは、文章内の回答の開始位置と終了位置を直接予測するエンドツーエンドシステムである。まず、私たちのモデルは質問に対して計算された関連性重みを乗じることで、文章中の各単語埋め込みベクトルを調整する。次に、双方向LSTMを使用して質問と重み付けされた文章をエンコードする。文章内の各ポイントについて、私たちのモデルは複数の視点からエンコードされた質問との文脈マッチングを行い、マッチングベクトルを生成する。これらのマッチングベクトルを与えることで、別の双方向LSTMを使用してすべての情報を集約し、開始位置と終了位置を予測する。SQuADテストセットでの実験結果は、私たちのモデルがリーダーボード上で競争力のある結果を得ていることを示している。