NLPCC2016 新闻数据集 机构 复旦大学 大小 18.29 MB 发布地址 github.com 分类 文本分类、文本摘要 许可协议 其他 发布日期 3 年前 标签 个人开发者、中文、新闻、自然语言处理 数据集下载 aria2c 下载 磁力链 HTTPS 下载 下载帮助 感谢您下载 NLPCC2016 新闻数据集! 本站基于知识共享许可协议,为国内用户提供公开数据集高速下载,仅用于科研与学术交流。 获得数据集更新通知、下载过程发现问题、提供未引入数据集资源等,请关注公众号与我们沟通。 感谢您下载 NLPCC2016 新闻数据集! 点击前往百度网盘下载页面 本站基于知识共享许可协议,为国内用户提供公开数据集高速下载,仅用于科研与学术交流。 关注公众号,获取数据集更新、人工智能相关的最新资讯 NLPCC2016 数据集与流行的新闻数据集不同,使用更多来自新浪微博的非正式文本。训练和测试数据由来自不同主题的微博组成,如金融、体育、娱乐等。该数据集为 utf-8 编码,可被用于中文分词任务 NLPCC2016.torrent 1 做种 0 下载 1557 已完成 NLPCC2016/README.md 928 B NLPCC2016/README.txt 928 B NLPCC2016/data/master.zip 18.29 MB 相关数据集推荐 Spot-the-diff 图像描述数据集 3 个月前 Spot-the-diff 数据集由 13,192 个图像对,以及相应的人工提供的文字标注组成。标注阐述了两个图像之间的差异。 MultiSense 词汇消歧数据集 4 个月前 MultiSense 是一个包含 9,504 幅图像的数据集,使用了英语、德语和西班牙语动词对这些图像进行了标注。 Talk2Car 自动驾驶数据集 4 个月前 Talk2Car 数据集是一个对象引用数据集,包含了用自然语言为自动驾驶汽车编写的命令,即乘客可以通过说话的形式对自动驾驶汽车下达命令。Talk2Car 数据集建立在 nuScenes 数据集之上,包括一套广泛的传感器模式,即语义地图、GPS、激光雷达、雷达和带有 3D boun…