NLPCC2016 新闻数据集

数据集下载 磁力链 HTTPS 下载 下载帮助

NLPCC2016 数据集与流行的新闻数据集不同,使用更多来自新浪微博的非正式文本。训练和测试数据由来自不同主题的微博组成,如金融、体育、娱乐等。该数据集为 utf-8 编码,可被用于中文分词任务

1 做种 0 下载 1697 已完成
  • NLPCC2016/README.md 928 B
  • NLPCC2016/README.txt 928 B
  • NLPCC2016/data/master.zip 18.29 MB