THUCNews データ セットは、2005 年から 2011 年までの新浪ニュースの履歴データ フィルタリングに基づいて生成されます。これには、740,000 件のニュース ドキュメントが含まれており、すべて UTF-8 プレーン テキスト形式で保存されています。このデータセットは再統合され、オリジナルの新浪ニュース分類システムに基づいて 14 の候補分類カテゴリに分割されています: 金融、宝くじ、不動産、株式、家庭、教育、テクノロジー、社会、ファッション、時事問題、スポーツ、星占い、ゲーム、 エンターテインメント
THUCNews.torrent
シーディング 2ダウンロード中 0ダウンロード完了 955総ダウンロード数 2,731