ImageNet-LT 全称 ImageNet Long-Tailed,是 ImageNet 数据集的一个子集。 该数据集由涉及 1,000 个类别的 115.8K 图像组成,单个类别最多的包含 1,280 张图像,最少的只包含 5 张。ImageNet-2010 中的 addi…
机构: The Chinese University of Hong Kong
PASCAL-Scribble 数据集:语义分割数据集
PASCAL-Scirbble 数据集又称 ScribbleSup,是 PASCAL 数据集的扩展,带有用于语义分割的 scribble (即乱涂乱画的涂鸦)标注。标注遵循两种不同的协议。 在第一个协议中,PASCAL VOC 2012 集 (https://hyper.ai/d…
Clothing1M 服装图像数据集
Clothing1M 包含涉及 14 个类别的 100 万张服装图片。该数据集是一个带有弱标注的数据集,这是因为数据是从几个在线购物网站收集的,包括了许多被误标的样本。 这个数据集包含 50k 、14k 和 10k 张带有强标注的图像,分别用于训练、验证和测试。
CompCars 汽车图像数据集
CompCars 全称 Comprehensive Cars,这是源于网络和监控两种场景下的汽车图像数据集。网络数据包含 163 个汽车品牌和 1,716 个汽车型号,监控数据包含了 5 万张汽车的正视图。该数据集总共有 136,726 张完整汽车的图像,27,618 张汽车零件…
RainCityscapes 降雨数据集
RainCityscapes 是一个带有场景深度信息的降雨图像数据集。数据集的照片均来自户外,每张照片中雨或雾的等级程度不同。
WLD 动物目标检测数据集
WLD 全称 WildLife Documentary,是一个用于动物目标检测的数据集。该数据集包含从 YouTube 下载的 15 部纪录片,其时长从 9 分钟到长达 50 分钟不等,并且总帧数超过 747,000。该数据集标注了 65 个类别的 4,000 多个对象的轨迹。该…
MAFL 人脸特征点检测数据集
长期以来,人脸特征点检测一直深受遮挡和姿态变化等问题的困扰。检测任务不再被看作是单一独立的问题,研究者尝试通过多任务学习来提升检测的鲁棒性。所以MAFL 数据集应运而生。MAFL 全称 Multi-Attribute Facial Landmark,由19,000 幅训练图像和 …
ExpW 表情识别数据集
ExpW (Expression in-the-Wild) 是一个关于表情识别的数据集,可用于通过人脸图像判断社交关系。数据集包含 91,793 张手动标注表情的人脸图像,表情类别分为 7 种:angry, disgust, fear, happy,sad, surprise, …
PETA 远距离行人识别数据集
PETA 全称 The PEdes Trian Attribute dataset,是用于远距离识别行人属性的图像数据集。比如远距离识别性别和服装风格。该数据集包含了 8,705 个行人、65 个属性(61 个二类属性和 4 个多类属性)和19,000 张图像。 该数据集主要应用…
CUFSF 人像素描数据集
CUFSF 全称 CUHK Face Sketch FERET,是一个人像素描数据集,可用于人脸素描合成和识别。原图来自于 FERET 数据集。 该数据集包含 1,195 对图像。每一张人脸,都对应一张光照变化的脸部照片和由艺术家据此绘制的带有夸张的素描。该数据集共涉及 200 …
FineGym 动作识别数据集
FineGym 是一个以体操视频为基础的动作识别数据集。与现有的同类型数据集相比,FineGym 数据集更加丰富、多样,而且品质更高。该数据集具有三级语义层级结构,给动作级和子动作级都提供了时间标注。例如一个“平衡木” 事件,可以被标注为一系列来自五个集合的基本子动作,而且这些集…
ECSSD 复杂场景显著性数据集
ECSSD 全称 Extended Complex Scene Saliency Dataset,是 CSSD 数据集的扩展。该数据集包含 1,000 张复杂场景图像及其 ground truth saliency map。这些图像由 5 名参与者进行人工标注。
DeepFashion2 服饰数据集
DeepFashion2 是一个包括衣物检测、姿态估计、分割及检索 4 个任务的通用基准。该数据集包括 80.1 万个服装类目 (clothes item),每个类目都有丰富的标注,如 style, scale, viewpoint, occlusion, bounding bo…
PIPAL 图像质量评价数据集
PIPAL 全称 Perceptual Image Processing ALgorithms,是一个感知图像处理算法的 IQA 数据集。由于图像重建 (IR) 算法的快速发展,特别是一些基于 GAN 的模型的出现,现有的图像质量评估 (IQA) 方法已经无法很好地评估这些图像重…
MovieNet 电影理解数据集
MovieNet 是一个用于电影理解的数据集,包含 1100 部电影,其中具有大量多模态数据,例如预告片、照片、情节描述等。此外,MovieNet 中提供了不同方面的手动标注,包括 110w 个带有 bounding box 和身份标注的角色,4.2w 场景边界, 2,500 对…