MSMARCO 机器阅读理解数据集

日期

5 年前

大小

259.55 MB

机构

Microsoft

发布地址

www.msmarco.org

MSMARCO 是机器阅读理解数据集,其包含的 1,010,916 个匿名问题均来自 Bing 的搜索查询日志,日志中均包含 AI 生成的答案和 182,669 条人为重写的答案,该数据集还包含从 3,563,535 个文档中提取的 8,841,823 个段落。

MSMARCO 数据集由微软于 2016 年发布,并在 2018 年更新,此外,该数据集拥有对应的排名比赛。

MSMARCO.torrent

做种 3

下载中 0

已完成 636

总下载 1,197

  • MSMARCO/
    • README.md
      1.03 KB
    • README.txt
      2.06 KB
      • data/
        • dev_v2.1.json.gz
          131.9 MB
        • eval_v2.1_public.json.gz
          259.55 MB