NLPCC2016 新闻数据集

日期

10 个月前

大小

18.29 MB

机构

发布地址

github.com

许可协议

其他

NLPCC2016 数据集与流行的新闻数据集不同,使用更多来自新浪微博的非正式文本。训练和测试数据由来自不同主题的微博组成,如金融、体育、娱乐等。该数据集为 utf-8 编码,可被用于中文分词任务

NLPCC2016.torrent

做种 1

下载中 0

已完成 803

总下载 1,913

  • NLPCC2016/
    • README.md
      928 字节
    • README.txt
      1.81 KB
      • data/
        • master.zip
          18.29 MB