Reuters-21578 テキスト分類データセット
ロイター - 21578 データセットは、テキスト分類研究用のテスト セットです。これはマルチクラス、マルチラベルのデータ セットであり、今後数年間で RCV1 に置き換えられる予定です。このデータ セットには 90 のクラス、7769 個のトレーニング ファイルが含まれています。および 3019 テスト ファイルは、Reuters-21578 ベンチマークの ModApte サブディレクトリにあります。
Reuters-21578 データ セットは、もともと 1987 年に CONSTRUE テキスト分類システムの開発過程でカーネギー グループとロイターによって収集され、ラベルが付けられました。その後、1997 年 9 月に AT&T Labs Research によってリリースされました。主な発行者は David D. Lewis です。関連論文は次のとおりです。
「文章分類の判定ルールの自動学習」
「言語に依存しないテキスト分類モデルの自動学習に向けて」
「TCS: コンテンツベースのテキスト分類のためのシェル」
「CONSTRUE/TIS: ニュース記事データベースのコンテンツベースのインデックス作成システム」
reuters21578.torrent
シーディング 2ダウンロード中 0ダウンロード完了 788総ダウンロード数 2,178