HotpotQA 问答数据集

数据集下载 磁力链 下载帮助

HotpotQA 数据集是一个在英文维基百科上收集的大规模问答数据集,包括 11.3 万个众包问题,要回答这些问题,需要参照两篇维基百科文章的介绍段落。每个问题都包含两个黄金段落 (gold paragraph) 以及部分段落中的句子列表,这些句子列表中提供的支持性事实,被认定为是回答问题所必需的。

该数据集具有以下特征:

  1. 问题需要在多个支持文档中查找和推理才能回答;
  2. 问题是多样化的,不受任何预先存在的知识库或知识模式的限制;
  3. 该数据集提供推理所需的句子级支持事实,让 QA 系统在强监督下进行推理并解释预测;
  4. 该数据集提供了一种新型的事实比较问题来测试 QA 系统提取相关事实并进行必要比较的能力。
1 做种 0 下载 10 已完成
  • HotpotQA/README.md 1.47 KB
  • HotpotQA/README.txt 1.47 KB
  • HotpotQA/data/hotpot_dev_distractor_v1.json 44.17 MB
  • HotpotQA/data/hotpot_dev_fullwiki_v1.json 45.26 MB
  • HotpotQA/data/hotpot_test_fullwiki_v1.json 44.07 MB
  • HotpotQA/data/hotpot_train_v1.1.json 540.19 MB