The Unsplash Lite Dataset 图片检索数据集精简版

Unsplash 是世界上最大的图片摄影网站之一,由全世界 20 多万摄影师参与贡献了数百万张高清优质的摄影作品。 Unsplash 在 2016 年开放了图片 API,截止目前已经达到了每月百万次调用,以及各种不同的使用场景。Unsplash 数据集于 2020 年八月宣布开放…

Visual Genome Dataset V1.2 图像及图像内容语义信息的数据集

Visual Genome 是图像及图像内容语义信息相关数据集,相比于 ImageNet 图像标注数据集拥有更为丰富的语义信息,其被用于拓展基于图像及语义信息的人工智能应用中。 该数据集目前包含 108249 张图片、420 万条区域内容描述、170 万条图像内容问答、210 万…

LSUN 20 Object Categories 大型图片数据集

LSUN 20 Object Categories Dataset 是一个大规模图像数据集,其基于人类在循环中进行深度学习的构建,其包含 20 个对象类别共计约 100 万张标记图像。 该数据集由加州大学伯克利分校等于 2015 年发布,主要发布人有 Fisher Yu、Pete…

LSUN 大规模图像数据集

LSUN Dataset 是一个大规模图像数据集,其基于人类在循环中进行深度学习的构建,包含 10 个场景类别和 20 个对象类别,共计约 100 万张标记图像。 该数据集由加州大学伯克利分校等于 2015 年发布,主要发布人有 Fisher Yu、Peter Kontschie…

SVHN 图像数据集

SVHN Dataset 是一个真实图像数据集,其被用于开发机器学习和对象识别算法,七对数据预处理和格式化的要求很低,该数据集与 MNIST 的特点相似,但是包含更多标记数据的数量级,且来自更加困难、未解决的现实世界问题。 该数据集由斯坦福大学于 2011 年发布,其中数据均采自…

TCGA-KICH 癌症 CT 影像

TCGA - KICH 癌症 CT 影像是腺瘤和腺癌相关的数据集,其包含来自 113 人共 2325 个数据文件,该数据集旨在对癌症诊治过程进行全程数字化跟踪,并以数字档案的形式记录检查结果、处方和疗效。 该数据集由 GDC Data Portal 发布。

TCGA-CESC 癌症 CT 影像

TCGA - CESC 癌症 CT 影像是宫颈鳞状细胞癌和子宫颈腺癌相关的数据集,其包含来自 307 人共 8595 个数据文件,该数据集旨在对癌症诊治过程进行全程数字化跟踪,并以数字档案的形式记录检查结果、处方和疗效。 该数据集由 GDC Data Portal 发布。

Personalized Medicine: Redefining Cancer Treatment 癌症肿瘤基因突变解释数据集

Personalized Medicine: Redefining Cancer Treatment Dataset 是一个对癌症肿瘤基因突变解释的数据集,其包含用于训练的基因突变描述文件和对基因突变进行分类的临床证据。 该数据集由 Kaggle 于 2018 年发布,相关数据均…

STL-10 Dataset 图像识别数据集

STL-10 Dataset 是用于开发无监督特征学习、深度学习、自学习算法的图像识别数据集,其基于 CIFAR-10 Dataset 做了一些修改。其中每个类别均包含比 CIFAR-10 更少的标记训练示例,但提供规模更大的未标记实例用于监督训练的图像学习模型,其利用未标记的数…

Stanford cars 汽车图像数据集

Stanford Cars Dataset 是包含 196 种汽车类型的图像数据集,主要用于图像分类,其共有 16,185 张图像,其中训练图像和测试图像分别为 8,144 张和 8,041 张,每个类别的图像数量相当,其中分类基于汽车品牌、车型和年份。 该数据集由斯坦福大学 -…

Food-101 食品图片数据集

Food - 101 Dataset 是包含 101 中食品类别的图像数据集,主要用于图像分类,共有 101,000 张图像,每个类别的测试图像和训练图像分别有 250 张和 750 张,其中训练图像未经数据清洗,但所有图像均以重新进行尺寸缩放,最大边长在 512 像素。 该数据…