HyperAI

PKU-Datensatz Für Vereinfachtes Chinesisch Zur Wortsegmentierung

Datum

vor einem Jahr

Größe

3.54 MB

Organisation

Peking-Universität

Veröffentlichungs-URL

sighan.cs.uchicago.edu

SIGHAN 2005 Der Datensatz International Chinese Automatic Word Segmentation Evaluation (kurz SIGHAN Evaluation) integriert Wortsegmentierungsdatensätze mehrerer Institutionen. Dieser Datensatz wurde gemeinsam von Microsoft Research China, der Peking University, der City University of Hong Kong und der Academia Sinica in Taiwan veröffentlicht und wird zum Trainieren und Auswerten chinesischer Wortsegmentierungsmodelle verwendet. Unter ihnen ist PKU ein vereinfachter chinesischer Datensatz zur Wortsegmentierung.

中文分词pku.torrent
Seeding 2Herunterladen 0Abgeschlossen 118Gesamtdownloads 401
  • 中文分词pku/
    • README.md
      1.06 KB
    • README.txt
      2.12 KB
      • data/
        • chinese_word_pku.zip
          3.54 MB