HyperAI

DuReader: Groß Angelegter Open-Domain-Datensatz Zum Maschinellen Leseverständnis in China

Datum

vor 3 Jahren

Größe

4.11 GB

Organisation

Baidu

Veröffentlichungs-URL

ai.baidu.com

Lizenz

其他

特色图像

DuReader ist ein groß angelegter chinesischer Open-Domain-Datensatz zum maschinellen Leseverständnis, der zum Trainieren oder Bewerten von Modellen und Systemen zum maschinellen Leseverständnis verwendet werden kann.

Der Datensatz besteht aus 200.000 Fragen, 420.000 Antworten und 1 Million Dokumenten. Die Fragen und Dokumente basieren auf Baidu Search und Baidu Knows und die Antworten werden manuell generiert. Der Datensatz bietet auch Anmerkungen zu den Fragetypen, wobei jede Frage manuell mit ihrer Kategorie gekennzeichnet ist: Entität, Beschreibung, Ja/Nein, Tatsache oder Meinung.

DuReader.torrent
Seeding 1Herunterladen 1Abgeschlossen 324Gesamtdownloads 608
  • DuReader/
    • README.md
      1.21 KB
    • README.txt
      2.41 KB
      • data/
        • dureader_preprocessed.zip
          2.79 GB
        • dureader_raw.zip
          4.11 GB