20 ニュースグループ ニュースグループ ドキュメント データ セット
20 Newsgroups は、約 20,000 のニュース ドキュメントで構成されるデータセットであり、機械学習におけるテキスト アプリケーションの実験に人気のデータセットとなっています。
このデータセットは 20 の異なるニュース グループに均等に分散されており、テキスト分類、テキスト マイニング、情報検索研究に使用される国際標準データセットの 1 つです。
20 のニュースグループ データ セットは、1995 年に Ken Lang によって第 12 回国際機械学習会議議事録に掲載されました。関連する論文は「Newsweeder: Learning to filter netnews」です。
20 Newsgroups.torrent
シーディング 2ダウンロード中 0ダウンロード完了 820総ダウンロード数 1,644