HyperAI

Sogou-Nachrichtendatensatz

Datum

vor 2 Jahren

Größe

366.5 MB

Organisation

Cornell Universität

Veröffentlichungs-URL

s3.amazonaws.com

Lizenz

非商业用途

* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

Der Sogou News Dataset ist ein Datensatz, der aus den Nachrichtenkorpora SogouCA und SogouCS besteht und 5 Kategorien mit insgesamt 2.909.551 Artikeln umfasst. Jede Kategorie enthält 90.000 Trainingsbeispiele und 12.000 Testbeispiele, und diese Beispiele werden in Pinyin konvertiert.

Sogou news.torrent
Seeding 2Herunterladen 0Abgeschlossen 1,096Gesamtdownloads 3,646
  • Sogou news/
    • README.md
      890 字节
    • README.txt
      1.74 KB
      • data/
        • Sogou news.zip
          366.5 MB