icwb2-data 中文分词数据集

icwb2-data 数据集是由北京大学、香港城市大学、台湾 CKIP, Academia Sinica 及中国微软研究所联合发布的数据集,用以进行中文分词模型的训练。其中 AS 和 CityU 为繁体中文数据集,PK 和 MSR 为简体中文数据集。

icwb2-data.torrent

做种 2

下载中 0

已完成 982

总下载 2,118

  • icwb2-data/
    • README.md
      939 字节
    • README.txt
      1.83 KB
      • data/
        • icwb2-data.zip
          50.2 MB