MSMARCO 机器阅读理解数据集

数据集下载 磁力链 下载帮助

OpenBayes 注册即获得免费算力

MSMARCO 是机器阅读理解数据集,其包含的 1,010,916 个匿名问题均来自 Bing 的搜索查询日志,日志中均包含 AI 生成的答案和 182,669 条人为重写的答案,该数据集还包含从 3,563,535 个文档中提取的 8,841,823 个段落。

MSMARCO 数据集由微软于 2016 年发布,并在 2018 年更新,此外,该数据集拥有对应的排名比赛。

2 做种 0 下载 243 已完成
文件名大小
README.md1.03 KB
README.txt1.03 KB
dev_v2.1.json.gz131.9 MB
eval_v2.1_public.json.gz127.65 MB