PKU 簡体字中国語単語セグメンテーション データ セット

シガン 2005 国際中国語自動分節評価データ セット (SIGHAN 評価と呼ばれる) は、複数の機関からの単語分節データ セットを統合します。このデータセットは、Microsoft Research China、北京大学、香港城市大学、台湾の中央研究院によって共同リリースされ、中国語単語セグメンテーション モデルのトレーニングと評価に使用されます。このうち、PKU は簡体字中国語の単語セグメンテーション データ セットです。

中文分词pku.torrent

做种 1

下载中 0

已完成 43

总下载 315

  • 中文分词pku/
    • README.md
      1.06 KB
    • README.txt
      2.12 KB
      • data/
        • chinese_word_pku.zip
          3.54 MB