HyperAI超神経

DuReader、大規模なオープンドメインの中国語機械読解データセット

日付

3年前

サイズ

4.11 GB

組織

百度

公開URL

ai.baidu.com

ライセンス

其他

特色图像

DuReader は、機械読解用の大規模なオープンドメインの中国語データセットであり、機械読解モデルおよびシステムのトレーニングまたは評価に使用できます。

データセットは、200,000 の質問、420,000 の回答、100 万のドキュメントで構成されています。質問とドキュメントは Baidu Search と Baidu Know に基づいており、回答は手動で生成されます。データセットは質問タイプの注釈も提供し、各質問にはエンティティ、説明、はいいいえ、事実、または意見の分類が手動で注釈付けされます。

DuReader.torrent
シーディング 1ダウンロード中 1ダウンロード完了 324総ダウンロード数 608
  • DuReader/
    • README.md
      1.21 KB
    • README.txt
      2.41 KB
      • data/
        • dureader_preprocessed.zip
          2.79 GB
        • dureader_raw.zip
          4.11 GB