DuReader: Groß Angelegter Open-Domain-Datensatz Zum Maschinellen Leseverständnis in China
Datum
Größe
Veröffentlichungs-URL
Paper-URL
Lizenz
Andere

DuReader ist ein groß angelegter chinesischer Open-Domain-Datensatz zum maschinellen Leseverständnis, der zum Trainieren oder Bewerten von Modellen und Systemen zum maschinellen Leseverständnis verwendet werden kann.
Der Datensatz besteht aus 200.000 Fragen, 420.000 Antworten und 1 Million Dokumenten. Die Fragen und Dokumente basieren auf Baidu Search und Baidu Knows und die Antworten werden manuell generiert. Der Datensatz bietet auch Anmerkungen zu den Fragetypen, wobei jede Frage manuell mit ihrer Kategorie gekennzeichnet ist: Entität, Beschreibung, Ja/Nein, Tatsache oder Meinung.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.