icwb2-data 数据集是由北京大学、香港城市大学、台湾 CKIP, Academia Sinica 及中国微软研究所联合发布的数据集,用以进行中文分词模型的训练。其中 AS 和 CityU 为繁体中文数据集,PK 和 MSR 为简体中文数据集。
2 做种
0 下载
1709 已完成
- icwb2-data/README.md 939 B
- icwb2-data/README.txt 939 B
- icwb2-data/data/icwb2-data.zip 50.2 MB