20 Newsgroups 新闻组文档数据集

数据集下载 磁力链 下载帮助

OpenBayes 注册即获得免费算力

20 Newsgroups 是由约 20,000 个新闻文档组成的数据集,目前已经成为机器学习中文本应用实验的流行数据集 。

该数据集在 20 个不同的新闻组中均匀分布,其也是被用于文本分类、文本挖据和信息检索研究的国际标准数据集之一。

20 Newsgroups 数据集由 Ken Lang 于 1995 年发布在第十二届国际机器学习会议论文集,相关论文为《Newsweeder: Learning to filter netnews》

1305 做种 18 下载 252 已完成
文件名大小
README.md1.19 KB
README.txt1.19 KB
20news-18828.tar.gz13.99 MB
20news-19997.tar.gz16.53 MB
20news-bydate.tar.gz13.79 MB