HyperAI超神経

NLPCC2016 ニュース データセット

日付

2年前

サイズ

18.29 MB

組織

復旦大学

公開URL

github.com

ライセンス

其他

NLPCC2016 データセットは一般的なニュース データセットとは異なり、新浪微博のより非公式なテキストを使用しています。トレーニング データとテスト データは、金融、スポーツ、エンターテイメントなど、さまざまなトピックのマイクロブログで構成されています。このデータ セットは utf-8 でエンコードされており、中国語の単語の分割タスクに使用できます。

NLPCC2016.torrent
シーディング 2ダウンロード中 0ダウンロード完了 974総ダウンロード数 2,218
  • NLPCC2016/
    • README.md
      928 字节
    • README.txt
      1.81 KB
      • data/
        • master.zip
          18.29 MB