HyperAI超神経

Reuters-21578 テキスト分類データセット

日付

2年前

サイズ

7.78 MB

組織

AT&T 研究所の研究

ロイター - 21578 データセットは、テキスト分類研究用のテスト セットです。これはマルチクラス、マルチラベルのデータ セットであり、今後数年間で RCV1 に置き換えられる予定です。このデータ セットには 90 のクラス、7769 個のトレーニング ファイルが含まれています。および 3019 テスト ファイルは、Reuters-21578 ベンチマークの ModApte サブディレクトリにあります。

Reuters-21578 データ セットは、もともと 1987 年に CONSTRUE テキスト分類システムの開発過程でカーネギー グループとロイターによって収集され、ラベルが付けられました。その後、1997 年 9 月に AT&T Labs Research によってリリースされました。主な発行者は David D. Lewis です。関連論文は次のとおりです。

「文章分類の判定ルールの自動学習」

「言語に依存しないテキスト分類モデルの自動学習に向けて」

「TCS: コンテンツベースのテキスト分類のためのシェル」

「CONSTRUE/TIS: ニュース記事データベースのコンテンツベースのインデックス作成システム」

reuters21578.torrent
シーディング 2ダウンロード中 0ダウンロード完了 788総ダウンロード数 2,178
  • reuters21578/
    • README.md
      1.46 KB
    • README.txt
      2.92 KB
      • data/
        • reuters21578.tar.gz
          7.78 MB