HotpotQA の質問と回答のデータ セット
日付
3年前
サイズ
673.69 MB
公開URL
ライセンス
CC BY-SA 4.0

HotpotQA データセットは、英語版 Wikipedia で収集された大規模な質問と回答のデータセットであり、クラウドソーシングされた 113,000 件の質問が含まれています。これらの質問に答えるには、Wikipedia の 2 つの記事の導入段落を参照する必要があります。各質問には、2 つのゴールド パラグラフと、質問に答えるために必要と思われる裏付けとなる事実を提供するそれらのパラグラフの文のリストが含まれています。
このデータセットには次の特徴があります。
- 質問に答えるには、複数の裏付け文書を検索して推論する必要があります。
- 問題は多様であり、既存の知識ベースや知識モデルに制約されません。
- このデータセットは推論に必要な文レベルの裏付け事実を提供し、QA システムが強力な監視の下で予測を推論して説明できるようにします。
- このデータセットは、関連する事実を抽出して必要な比較を行う QA システムの能力をテストするための、新しいタイプの事実比較質問を提供します。
HotpotQA.torrent
シーディング 1ダウンロード中 1ダウンロード完了 409総ダウンロード数 792