icwb2-data 中国語単語セグメンテーション データ セット

icwb2-data データセットは、北京大学、香港城市大学、台湾 CKIP、中央研究院、中国マイクロソフト研究所が共同でリリースしたデータセットで、中国語単語セグメンテーション モデルのトレーニングに使用されます。このうち、AS と CityU は繁体字中国語のデータセットであり、PK と MSR は簡体字中国語のデータセットです。

icwb2データ.torrent
シーディング 3ダウンロード中 0ダウンロード完了 1,218総ダウンロード数 2,484
  • icwb2-data/
    • README.md
      939 字节
    • README.txt
      1.83 KB
      • data/
        • icwb2-data.zip
          50.2 MB