HyperAI超神経

Icwb2-data 中国語単語セグメンテーション データ セット

icwb2-data データセットは、北京大学、香港城市大学、台湾 CKIP、中央研究院、中国マイクロソフト研究所が共同でリリースしたデータセットで、中国語単語セグメンテーション モデルのトレーニングに使用されます。このうち、AS と CityU は繁体字中国語のデータセットであり、PK と MSR は簡体字中国語のデータセットです。

icwb2-data.torrent
シーディング 1ダウンロード中 0ダウンロード完了 1,084総ダウンロード数 2,301
  • icwb2-data/
    • README.md
      939 字节
    • README.txt
      1.83 KB
      • data/
        • icwb2-data.zip
          50.2 MB