数据集索引

我们共收集了 344 个公开数据集资源,整理并提供相应的存储服务
免费提供给相关从业人员进行下载

大家都在找…

7 个公开数据集
39 个公开数据集
7 个公开数据集
  • Finding lungs in CT 是基于肺部 CT 影像分割处理的数据集,其包含一系列 CT 影像中对肺部影像的分…
  • TCGA - CESC 癌症 CT 影像是宫颈鳞状细胞癌和子宫颈腺癌相关的数据集,其包含来自 307 人共 8595 个…
  • TCGA - ESCA 癌症 CT 影像是食道癌相关的数据集,其包含来自 185 人共 5271 个数据文件,该数据集旨…
  • TCGA - KICH 癌症 CT 影像是腺瘤和腺癌相关的数据集,其包含来自 113 人共 2325 个数据文件,该数据…

图像分类

图像分类描述
29 个公开数据集
1 个公开数据集
3 个公开数据集
  • COCO 是一个大型图像数据集,其被用于机器视觉领域的对象检测与分割、人物关键点检测、填充分割与字幕生成。该数据集以场景…
  • NYU Depth V2 是各种室内场景视频序列组成的数据集,主要用于图像描述研究,其图像来自于 Microsoft K…
4 个公开数据集
  • MedMNIST 由上海交通大学于 2020 年 10 月 28 日发布,是一个包含 10 个医学公开数据集的集合,共计…
  • xBD 数据集是迄今为止第一个建筑破坏评估数据集,是带注释的高分辨率卫星图像的规模最大、质量最高的公共数据集之一。 该数…
  • TWDNE(This Waifu Does Not Exist)包含 10 万+二次元动漫头像及通过 StyleGAN …
8 个公开数据集
  • COCO 是一个大型图像数据集,其被用于机器视觉领域的对象检测与分割、人物关键点检测、填充分割与字幕生成。该数据集以场景…
  • MPII 是用于评估人体姿势估计的数据集以及相关基准,拥有约 2.5 万张图像并且包含超过 4 万名具有注释关节的人,该…
  • MVTec ITODD 是用于 3D 物体检测和姿态估计的公共数据集,其重点关注工业设置和应用,该数据集由 28 个对象…
  • Leeds Sports Pose 是一个体育姿势数据集,其被分为竞技、羽毛球、棒球、体操、跑酷、足球、排球和网球几类,…
  • FLIC 是从电影的帧中标记人物的图像数据集,其包含从主流好莱坞电影中收集的 5003 张图像。 训练图像来源于 30 …
6 个公开数据集
10 个公开数据集
20 个公开数据集
4 个公开数据集
3 个公开数据集
  • MSRA - TD500 图像数据集被用于评估文本检测算法基准,它包含多种类和多国语言的 500 张自然图像,分别是 3…
  • SynthText 数据集由包含单词的自然场景图像组成,其主要运用于自然场景中的文本检测,该数据集由 80 万个图像组成…
3 个公开数据集
8 个公开数据集
2 个公开数据集
38 个公开数据集
3 个公开数据集
54 个公开数据集
  • PubFig Dataset 是一个大型人脸数据集,主要用于人脸识别和身份鉴定,其涵盖互联网上 200 人的 58,79…
  • Udacity Dataset 是一套带注释的图片数据集,主要用于自动驾驶,其包含的两个子数据集分别有 9423 和 1…
  • CelebFaces(CelebA)Dataset 是一个大型人脸属性数据集,拥有超过 200k 的名人图像,其中每张图…
  • COCO 是一个大型图像数据集,其被用于机器视觉领域的对象检测与分割、人物关键点检测、填充分割与字幕生成。该数据集以场景…
  • ImageNet Dataset 是目前世界上最大的图像识别数据库,主要用于机器视觉领域的图像分类和目标检测,根据 Wo…
23 个公开数据集
  • 扩展的耶鲁人脸数据库 B 是一个人脸数据集,主要用于身份鉴定,其包含 28 个人类对象在 64 种照明条件下的 9 种姿…
  • YouTube - 8M 是一个带标签的大型视频数据集,它由数百万个 YouTube 视频 ID 组成,包含的 3800…
  • SVHN Dataset 是一个真实图像数据集,其被用于开发机器学习和对象识别算法,七对数据预处理和格式化的要求很低,该…
  • ADE20K Dataset 是用于场景解析的数据集,其包含 150 中物体类型,可被用于场景感知、解析、分割、多物体识…
  • Caltech-101 Dataset 是由 101 个类别的对象图片组成的数据集,它主要用于目标识别和图像分类。不同类…
12 个公开数据集
  • Udacity Dataset 是一套带注释的图片数据集,主要用于自动驾驶,其包含的两个子数据集分别有 9423 和 1…
  • GOT-10k 是一个基于 WordNet 的大型目标跟踪数据集,广泛覆盖了 560 类户外常见的移动物体,物体的边界框…
  • KITTI 是一套计算机视觉算法评测数据集,其主要用于自动驾驶场景下的相关测试,评测种类涵盖立体图像、光流、视觉测距、3…
  • YouTube - 8M 是一个带标签的大型视频数据集,它由数百万个 YouTube 视频 ID 组成,包含的 3800…
  • Dataset-UAV-123 是由低空无人机捕获视频组成的数据集,这与 OTB50、VOT2014 等主流跟踪数据集中…
29 个公开数据集
  • LMD-full数据集全称为The Lakh MIDI Dataset v0.1完整版,该数据集有超过17万个独一的MI…
  • 该数据集由科罗拉多州丹佛市提供,包括了过去四年及今年丹佛市警方对于行人与车辆的停靠记录。该数据集包括时间、地点、问题、描…
  • 该数据集由科罗拉多州丹佛市提供,包括了过去五年中丹佛市的犯罪记录。这些数据都是基于美国国家事件报告系统(NIBRS),且…
  • 此数据集包含纽约市官方工作网站上提供的当前职位发布,包括对于城市员工内部发布的工作和对于大众公开发布的工作。这是纽约市主…
  • 环境修复站点是指根据DEC补救计划之一进行修复的区域,该环境整治站点数据集是由美国纽约州发布整理,包含已被修复或正在管理…
12 个公开数据集
  • icwb2-data数据集是由北京大学、香港城市大学、台湾CKIP, Academia Sinica及中国微软研究所联合…
  • 该数据集包含3个领域的1225个单词的类比。具体内容有687个国家首都类词语,175个城市省份类词语和240个家庭关系类…
  • UD-Chinese-GSD数据集是中文繁体自然语言处理数据集,用以中文分词等工作的训练,也可用作多语言编译器开发及跨语…
  • wordsim-240数据集为词向量数据集,向量表征了每个词的单词的句法和语义信息,这些信息可用于解决各种NLP任务。该…
  • wordsim-297数据集为词向量数据集,向量表征了每个词的单词的句法和语义信息,这些信息可用于解决各种NLP任务。该…
1 个公开数据集
1 个公开数据集
44 个公开数据集
  • COCO 是一个大型图像数据集,其被用于机器视觉领域的对象检测与分割、人物关键点检测、填充分割与字幕生成。该数据集以场景…
  • SemanticKITTI 是自动驾驶领域的权威数据集,它基于 KITTI 数据集,对 KITTI Vision Odo…
  • KITTI 是一套计算机视觉算法评测数据集,其主要用于自动驾驶场景下的相关测试,评测种类涵盖立体图像、光流、视觉测距、3…
  • YouTube - 8M 是一个带标签的大型视频数据集,它由数百万个 YouTube 视频 ID 组成,包含的 3800…
  • PASCAL VOC DATASET 由 Pascol VOC 项目组于 2012 年发布,其包含往届 PASCAL V…
6 个公开数据集
12 个公开数据集
5 个公开数据集