DuReader 大规模开放域中文机器阅读理解数据集

数据集下载 磁力链 下载帮助

DuReader 是一个面向机器阅读理解的大型开放域中文数据集,可用于训练或评估机器阅读理解模型和系统。

该数据集由 20 万个问题、42 万个答案和 100 万个文档组成。问题和文档基于百度搜索和百度知道,答案由人工生成。该数据集还提供了问题类型的注释,每道问题都被手动标注了其分类:Entity, Description, YesNo, Fact 或 Opinion。

1 做种 0 下载 45 已完成
  • DuReader/README.md 1.21 KB
  • DuReader/README.txt 1.21 KB
  • DuReader/data/dureader_preprocessed.zip 2.79 GB
  • DuReader/data/dureader_raw.zip 1.32 GB