HyperAI

NLPCC2016-Nachrichtendatensatz

Datum

vor 2 Jahren

Größe

18.29 MB

Organisation

Fudan-Universität

Veröffentlichungs-URL

github.com

Lizenz

其他

Der NLPCC2016-Datensatz unterscheidet sich von gängigen Nachrichtendatensätzen und verwendet eher informellen Text von Sina Weibo. Die Trainings- und Testdaten bestehen aus Mikroblogs zu verschiedenen Themen wie Finanzen, Sport, Unterhaltung usw. Dieser Datensatz ist UTF-8-codiert und kann für chinesische Wortsegmentierungsaufgaben verwendet werden.

NLPCC2016.torrent
Seeding 3Herunterladen 0Abgeschlossen 974Gesamtdownloads 2,218
  • NLPCC2016/
    • README.md
      928 字节
    • README.txt
      1.81 KB
      • data/
        • master.zip
          18.29 MB