ImageNet 是目前世界上最大的图像识别数据库,主要用于机器视觉领域的图像分类和目标检测。数据集根据 WordNet 层次结构组织,其中每个节点(也称为类别)由数百甚至数千张图像组成,每个节点有平均超过 500 个图像。该数据集共包含 2.2 万个图像类别,约 1500 万张…
机构: Stanford University
CheXpert X 射线胸片数据集
CheXpert 全称 Chest eXpert,是一个用于解释 X 射线胸片的大型数据集。 该数据集包括来自 65,240 位患者的 224,316 张含正面和侧面视图的 X 射线胸片,具有不确定性医学标签和放射科医生标注的参考标准评估集,可用于预测来自多视角胸片的 14 种不…
Stanford Dogs 斯坦福犬类数据集
斯坦福犬类数据集包含来自于世界各地的 120 种犬类图像,图像及其标注都来自 ImageNet 数据集,适用于精细图像分类任务。 该数据集包括: 种类数量:120图像数量:20,580(12,000 张用于训练,8,580 张用于测试)标注:类别标签,边界框
MURA 骨 X 光数据集
MURA Dataset 是一个大型骨骼 X 光片数据集,旨在通过 X 光片确定骨骼是否正常,该数据集由斯坦福大学于 2017 年发布,相关论文有《MURA: Large Dataset for Abnormality Detection in Musculoskeletal R…
STL-10 Dataset 图像识别数据集
STL-10 Dataset 是用于开发无监督特征学习、深度学习、自学习算法的图像识别数据集,其基于 CIFAR-10 Dataset 做了一些修改。其中每个类别均包含比 CIFAR-10 更少的标记训练示例,但提供规模更大的未标记实例用于监督训练的图像学习模型,其利用未标记的数…
Stanford cars 汽车图像数据集
Stanford Cars Dataset 是包含 196 种汽车类型的图像数据集,主要用于图像分类,其共有 16,185 张图像,其中训练图像和测试图像分别为 8,144 张和 8,041 张,每个类别的图像数量相当,其中分类基于汽车品牌、车型和年份。 该数据集由斯坦福大学 -…
Food-101 食品图片数据集
Food - 101 Dataset 是包含 101 中食品类别的图像数据集,主要用于图像分类,共有 101,000 张图像,每个类别的测试图像和训练图像分别有 250 张和 750 张,其中训练图像未经数据清洗,但所有图像均以重新进行尺寸缩放,最大边长在 512 像素。 该数据…
Visual Genome Dataset V1.2 图像及图像内容语义信息的数据集
Visual Genome 是图像及图像内容语义信息相关数据集,相比于 ImageNet 图像标注数据集拥有更为丰富的语义信息,其被用于拓展基于图像及语义信息的人工智能应用中。 该数据集目前包含 108249 张图片、420 万条区域内容描述、170 万条图像内容问答、210 万…
Gibson Environment 感知数据集
Gibson Environment 是一个开源的感知和模拟数据集。数据集用于探索机器人的主动和对现实世界的感知,对现实世界进行感知学习。数据集基于虚拟化的真实空间,而非人工设计的空间。数据集包含了 572栋完整建筑的 1,400 多个楼层空间。该数据集主要特点是:I. 来自现实…
PASCAL-Part 目标检测数据集
PASCAL-Part 是 PASCAL VOC 2010 数据集的一组附加标注,为检测对象的每个身体部位提供分割掩码。而对于像船那样部件并不一致的检测对象,该数据集则会提供轮廓标注。 此外,PASCAL-Part 也可用以进行人体语义部分分割,包含了所有图像中的人像(其中 1,…
ShapeNet – 3D 形状数据集
ShapeNet Dataset 是一个注释丰富且规模较大的 3D 形状数据集,其被用于协助计算机图形学、计算机视觉、机器人学以及其他相关学科的研究工作。 该数据集由斯坦福大学、普林斯顿大学和芝加哥丰田技术学院于 2015 年联合发布,相关论文有《ShapeNet: An Inf…
Visual Genome 密集标注数据集
Visual Genome Dataset 是一个通过众包密集图像标注,来连接语言和视觉的数据集,包含了多选环境下的 Visual Question Answering 数据。 该数据集包括 101,174 张 MSCOCO 图像的 170 万对 QA,平均每张图像 17 个问题…
PASCAL3D+ 3D 物体检测和姿态识别数据集
PASCAL 3D+ 是一个 3D 物体检测和姿态识别数据集,包括 PASCAL VOC 2012 中 12 个类别物体的 3D 标注,平均每个类别中包含 3000 个实例。 该数据集由斯坦福大学于 2014 年发布,相关论文有《Beyond PASCAL: A Benchmar…
Unsplash 照片数据集(完整版)
Unsplash 数据集涉及 25 万+ 摄影师和数亿条搜索记录,涉及数千种应用、用途和场景。 该数据集分为两个版本: 精简版可用作商业和非商业用途,包含 25,000 张自然主题图像,25,000 个关键词,100 万条搜索记录。 完整版仅用作非商业用途,包含 300 万+ 图…
SVHN 图像数据集
SVHN Dataset 是一个真实图像数据集,其被用于开发机器学习和对象识别算法,七对数据预处理和格式化的要求很低,该数据集与 MNIST 的特点相似,但是包含更多标记数据的数量级,且来自更加困难、未解决的现实世界问题。 该数据集由斯坦福大学于 2011 年发布,其中数据均采自…