DuReader 大规模开放域中文机器阅读理解数据集

日期

2 年前

大小

4.11 GB

机构

Baidu

发布地址

ai.baidu.com

许可协议

其他

特色图像

DuReader 是一个面向机器阅读理解的大型开放域中文数据集,可用于训练或评估机器阅读理解模型和系统。

该数据集由 20 万个问题、 42 万个答案和 100 万个文档组成。问题和文档基于百度搜索和百度知道,答案由人工生成。该数据集还提供了问题类型的注释,每道问题都被手动标注了其分类:Entity, Description, YesNo, Fact 或 Opinion 。

DuReader.torrent

做种 2

下载中 0

已完成 243

总下载 471

  • DuReader/
    • README.md
      1.21 KB
    • README.txt
      2.41 KB
      • data/
        • dureader_preprocessed.zip
          2.79 GB
        • dureader_raw.zip
          4.11 GB