NLPCC2016-Nachrichtendatensatz
Datum
vor 2 Jahren
Größe
18.29 MB
Veröffentlichungs-URL
Lizenz
其他
Kategorien
Der NLPCC2016-Datensatz unterscheidet sich von gängigen Nachrichtendatensätzen und verwendet eher informellen Text von Sina Weibo. Die Trainings- und Testdaten bestehen aus Mikroblogs zu verschiedenen Themen wie Finanzen, Sport, Unterhaltung usw. Dieser Datensatz ist UTF-8-codiert und kann für chinesische Wortsegmentierungsaufgaben verwendet werden.
NLPCC2016.torrent
Seeding 3Herunterladen 0Abgeschlossen 974Gesamtdownloads 2,218