HyperAI

PKU-Datensatz Für Vereinfachtes Chinesisch Zur Wortsegmentierung

Datum

vor einem Jahr

Größe

3.54 MB

Organisation

Peking-Universität

Veröffentlichungs-URL

sighan.cs.uchicago.edu

SIGHAN 2005 Der Datensatz International Chinese Automatic Word Segmentation Evaluation (kurz SIGHAN Evaluation) integriert Wortsegmentierungsdatensätze mehrerer Institutionen. Dieser Datensatz wurde gemeinsam von Microsoft Research China, der Peking University, der City University of Hong Kong und der Academia Sinica in Taiwan veröffentlicht und wird zum Trainieren und Auswerten chinesischer Wortsegmentierungsmodelle verwendet. Unter ihnen ist PKU ein vereinfachter chinesischer Datensatz zur Wortsegmentierung.

中文分词pku.torrent
Seeding 1Herunterladen 0Abgeschlossen 171Gesamtdownloads 471
  • 中文分词pku/
    • README.md
      1.06 KB
    • README.txt
      2.12 KB
      • data/
        • chinese_word_pku.zip
          3.54 MB