HyperAI

DuReader Ensemble De Données De Compréhension De Lecture Automatique Chinoise À Grande Échelle Et À Domaine Ouvert

特色图像

DuReader est un ensemble de données chinois à domaine ouvert à grande échelle pour la compréhension de lecture automatique, qui peut être utilisé pour former ou évaluer des modèles et des systèmes de compréhension de lecture automatique.

L'ensemble de données comprend 200 000 questions, 420 000 réponses et 1 million de documents. Les questions et les documents sont basés sur Baidu Search et Baidu Knows, et les réponses sont générées manuellement. L'ensemble de données fournit également des annotations sur les types de questions, et chaque question est étiquetée manuellement avec sa catégorie : Entité, Description, Oui/Non, Fait ou Opinion.

DuReader.torrent
Partage 1Téléchargement 1Terminés 324Téléchargements totaux 608
  • DuReader/
    • README.md
      1.21 KB
    • README.txt
      2.41 KB
      • data/
        • dureader_preprocessed.zip
          2.79 GB
        • dureader_raw.zip
          4.11 GB