HyperAI超神经

MSMARCO 机器阅读理解数据集

日期

6 years ago

大小

259.55 MB

机构

Microsoft

发布地址

www.msmarco.org

MSMARCO 是机器阅读理解数据集,其包含的 1,010,916 个匿名问题均来自 Bing 的搜索查询日志,日志中均包含 AI 生成的答案和 182,669 条人为重写的答案,该数据集还包含从 3,563,535 个文档中提取的 8,841,823 个段落。

MSMARCO 数据集由微软于 2016 年发布,并在 2018 年更新,此外,该数据集拥有对应的排名比赛。

MSMARCO.torrent
做种 3正在下载 0已完成 1,150总下载次数 1,449
  • MSMARCO/
    • README.md
      1.03 KB
    • README.txt
      2.06 KB
      • data/
        • dev_v2.1.json.gz
          131.9 MB
        • eval_v2.1_public.json.gz
          259.55 MB