icwb2-data 中文分词数据集

数据集下载 磁力链 HTTPS 下载 下载帮助

icwb2-data 数据集是由北京大学、香港城市大学、台湾 CKIP, Academia Sinica 及中国微软研究所联合发布的数据集,用以进行中文分词模型的训练。其中 AS 和 CityU 为繁体中文数据集,PK 和 MSR 为简体中文数据集。

1 做种 0 下载 1402 已完成
  • icwb2-data/README.md 939 B
  • icwb2-data/README.txt 939 B
  • icwb2-data/data/icwb2-data.zip 50.2 MB