20 Newsgroups は、約 20,000 のニュース ドキュメントで構成されるデータセットであり、機械学習におけるテキスト アプリケーションの実験に人気のデータセットとなっています。
このデータセットは 20 の異なるニュース グループに均等に分散されており、テキスト分類、テキスト マイニング、情報検索研究に使用される国際標準データセットの 1 つです。
20 のニュースグループ データ セットは、1995 年に Ken Lang によって第 12 回国際機械学習会議議事録に掲載されました。関連する論文は「Newsweeder: Learning to filter netnews」です。
做种 2
下载中 0
已完成 757
总下载 1,576