PKU-Datensatz Für Vereinfachtes Chinesisch Zur Wortsegmentierung
Datum
vor einem Jahr
Größe
3.54 MB
Veröffentlichungs-URL
Kategorien
SIGHAN 2005 Der Datensatz International Chinese Automatic Word Segmentation Evaluation (kurz SIGHAN Evaluation) integriert Wortsegmentierungsdatensätze mehrerer Institutionen. Dieser Datensatz wurde gemeinsam von Microsoft Research China, der Peking University, der City University of Hong Kong und der Academia Sinica in Taiwan veröffentlicht und wird zum Trainieren und Auswerten chinesischer Wortsegmentierungsmodelle verwendet. Unter ihnen ist PKU ein vereinfachter chinesischer Datensatz zur Wortsegmentierung.
中文分词pku.torrent
Seeding 2Herunterladen 0Abgeschlossen 118Gesamtdownloads 401