日期
大小
机构
发布地址
thuctc.thunlp.org
许可协议
其他
标签
国内高校
新闻
统计型数据
分类
文本分类
预测统计
THUCNews 数据集是根据新浪新闻 2005~2011 年间的历史数据筛选过滤生成,包含 74 万篇新闻文档,均为 UTF-8 纯文本格式。此数据集在原始新浪新闻分类体系的基础上,重新整合划分出 14 个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐
做种 2
下载中 0
已完成 761
总下载 2,272