HyperAI超神経

THUCNews ニュース データ セット

日付

2年前

サイズ

1.45 GB

組織

清華大学

ライセンス

其他

THUCNews データ セットは、2005 年から 2011 年までの新浪ニュースの履歴データ フィルタリングに基づいて生成されます。これには、740,000 件のニュース ドキュメントが含まれており、すべて UTF-8 プレーン テキスト形式で保存されています。このデータセットは再統合され、オリジナルの新浪ニュース分類システムに基づいて 14 の候補分類カテゴリに分割されています: 金融、宝くじ、不動産、株式、家庭、教育、テクノロジー、社会、ファッション、時事問題、スポーツ、星占い、ゲーム、 エンターテインメント

THUCNews.torrent
シーディング 2ダウンロード中 0ダウンロード完了 955総ダウンロード数 2,731
  • THUCNews/
    • README.md
      1.01 KB
    • README.txt
      2.01 KB
      • data/
        • THUCNews.zip
          1.45 GB