icwb2-data 中国語単語セグメンテーション データ セット

icwb2-data データセットは、北京大学、香港城市大学、台湾 CKIP、中央研究院、中国マイクロソフト研究所が共同でリリースしたデータセットで、中国語単語セグメンテーション モデルのトレーニングに使用されます。このうち、AS と CityU は繁体字中国語のデータセットであり、PK と MSR は簡体字中国語のデータセットです。

icwb2-data.torrent

做种 4

下载中 1

已完成 1,010

总下载 2,160

  • icwb2-data/
    • README.md
      939 字节
    • README.txt
      1.83 KB
      • data/
        • icwb2-data.zip
          50.2 MB