HotpotQA 问答数据集

日期

2 年前

大小

673.69 MB

机构

发布地址

hotpotqa.github.io

许可协议

CC BY-SA 4.0

特色图像

HotpotQA 数据集是一个在英文维基百科上收集的大规模问答数据集,包括 11.3 万个众包问题,要回答这些问题,需要参照两篇维基百科文章的介绍段落。每个问题都包含两个黄金段落 (gold paragraph) 以及部分段落中的句子列表,这些句子列表中提供的支持性事实,被认定为是回答问题所必需的。

该数据集具有以下特征:

  1. 问题需要在多个支持文档中查找和推理才能回答;
  2. 问题是多样化的,不受任何预先存在的知识库或知识模式的限制;
  3. 该数据集提供推理所需的句子级支持事实,让 QA 系统在强监督下进行推理并解释预测;
  4. 该数据集提供了一种新型的事实比较问题来测试 QA 系统提取相关事实并进行必要比较的能力。
HotpotQA.torrent

做种 3

下载中 0

已完成 283

总下载 472

  • HotpotQA/
    • README.md
      1.47 KB
    • README.txt
      2.95 KB
      • data/
        • hotpot_dev_distractor_v1.json
          44.18 MB
        • hotpot_dev_fullwiki_v1.json
          89.43 MB
        • hotpot_test_fullwiki_v1.json
          133.51 MB
        • hotpot_train_v1.1.json
          673.69 MB