NLPCC2016 新闻数据集 机构 复旦大学 大小 18.29 MB 发布地址 github.com 分类 文本分类、文本摘要 许可协议 其他 发布日期 4 年前 标签 个人开发者、中文、新闻、自然语言处理 数据集下载 aria2c 下载 磁力链 HTTPS 下载 下载帮助 感谢您下载 NLPCC2016 新闻数据集! 本站基于知识共享许可协议,为国内用户提供公开数据集高速下载,仅用于科研与学术交流。 获得数据集更新通知、下载过程发现问题、提供未引入数据集资源等,请关注公众号与我们沟通。 感谢您下载 NLPCC2016 新闻数据集! 点击前往百度网盘下载页面 本站基于知识共享许可协议,为国内用户提供公开数据集高速下载,仅用于科研与学术交流。 关注公众号,获取数据集更新、人工智能相关的最新资讯 NLPCC2016 数据集与流行的新闻数据集不同,使用更多来自新浪微博的非正式文本。训练和测试数据由来自不同主题的微博组成,如金融、体育、娱乐等。该数据集为 utf-8 编码,可被用于中文分词任务 NLPCC2016.torrent 1 做种 0 下载 1697 已完成 NLPCC2016/README.md 928 B NLPCC2016/README.txt 928 B NLPCC2016/data/master.zip 18.29 MB 相关数据集推荐 ImageNet 10 图像识别数据集 4 年前 ImageNet 是目前世界上最大的图像识别数据库,主要用于机器视觉领域的图像分类和目标检测。数据集根据 WordNet 层次结构组织,其中每个节点(也称为类别)由数百甚至数千张图像组成,每个节点有平均超过 500 个图像。该数据集共包含 2.2 万个图像类别,约 1500 万张… OpenMantra 漫画机器翻译评估数据集 2 年前 该数据集是一个针对日文漫画的机器翻译评估数据集,包含五种不同风格(幻想、爱情、战斗、悬疑、生活)的漫画,数据集中共包含 1593 个句子,848 个场景画面和 214 页漫画,由东京大学 Mantra 团队发布。 数据格式:带注释的 JSON 文件和原始图像 AVSpeech – 视听语音数据集 4 年前 AVSpeech是一个新的、大规模的视听数据集,包括没有干扰的背景噪音的语音视频片段。这些片段的长度为 3-10 秒,在每个片段中,原声带中的听到的声音,属于视频中可看见的唯一在说话的人。 该数据集包含大约 4700 小时的视频片段,来自 29 万个 YouTube 视频,涵盖了…