2ヶ月前
再帰的なスパン表現を学習して抽出型質問応答を行う
Kenton Lee; Shimi Salant; Tom Kwiatkowski; Ankur Parikh; Dipanjan Das; Jonathan Berant

要約
与えられた証拠文書に関する質問を行う読解タスクは、自然言語理解における中心的な問題です。このタスクの最近の取り組みでは、通常、手動または外部のNLPパイプラインを使用して事前に定義された候補から答えを選択することに焦点を当てています。しかし、Rajpurkarら(2016)は最近、SQuADデータセットを公開しました。このデータセットでは、答えは提供されたテキスト内の任意の文字列である可能性があります。本論文では、この答え抽出タスクに焦点を当て、証拠文書内のすべての区間について固定長表現を効率的に構築する新しいモデルアーキテクチャを提示します。このモデルは再帰ネットワークを使用しています。我々は、明示的な区間表現のスコアリングが、単語や開始・終了マーカーについて個別に予測を行う他の手法よりも大幅に性能が向上することを示しています。我々のアプローチはWang & Jiang(2016)の最も良い既存結果に対して5%改善し、Rajpurkarらのベースラインエラーを50%以上減少させました。