20 Newsgroups 新闻组文档数据集

数据集下载 磁力链 下载帮助

20 Newsgroups 是由约 20,000 个新闻文档组成的数据集,目前已经成为机器学习中文本应用实验的流行数据集 。

该数据集在 20 个不同的新闻组中均匀分布,其也是被用于文本分类、文本挖据和信息检索研究的国际标准数据集之一。

20 Newsgroups 数据集由 Ken Lang 于 1995 年发布在第十二届国际机器学习会议论文集,相关论文为《Newsweeder: Learning to filter netnews》

2 做种 0 下载 1219 已完成
  • 20 Newsgroups/README.md 1.19 KB
  • 20 Newsgroups/README.txt 1.19 KB
  • 20 Newsgroups/data/20news-18828.tar.gz 13.99 MB
  • 20 Newsgroups/data/20news-19997.tar.gz 16.53 MB
  • 20 Newsgroups/data/20news-bydate.tar.gz 13.79 MB