PETA 远距离行人识别数据集

PETA 全称 The PEdes Trian Attribute dataset,是用于远距离识别行人属性的图像数据集。比如远距离识别性别和服装风格。该数据集包含了 8,705 个行人、65 个属性(61 个二类属性和 4 个多类属性)和19,000 张图像。 该数据集主要应用…

CUFSF 人像素描数据集

CUFSF 全称 CUHK Face Sketch FERET,是一个人像素描数据集,可用于人脸素描合成和识别。原图来自于 FERET 数据集。 该数据集包含 1,195 对图像。每一张人脸,都对应一张光照变化的脸部照片和由艺术家据此绘制的带有夸张的素描。该数据集共涉及 200 …

FineGym 动作识别数据集

FineGym 是一个以体操视频为基础的动作识别数据集。与现有的同类型数据集相比,FineGym 数据集更加丰富、多样,而且品质更高。该数据集具有三级语义层级结构,给动作级和子动作级都提供了时间标注。例如一个“平衡木” 事件,可以被标注为一系列来自五个集合的基本子动作,而且这些集…

MAFL 人脸特征点检测数据集

长期以来,人脸特征点检测一直深受遮挡和姿态变化等问题的困扰。检测任务不再被看作是单一独立的问题,研究者尝试通过多任务学习来提升检测的鲁棒性。所以MAFL 数据集应运而生。MAFL 全称 Multi-Attribute Facial Landmark,由19,000 幅训练图像和 …

DeepFashion2 服饰数据集

DeepFashion2 是一个包括衣物检测、姿态估计、分割及检索 4 个任务的通用基准。该数据集包括 80.1 万个服装类目 (clothes item),每个类目都有丰富的标注,如 style, scale, viewpoint, occlusion, bounding bo…

PIPAL 图像质量评价数据集

PIPAL 全称 Perceptual Image Processing ALgorithms,是一个感知图像处理算法的 IQA 数据集。由于图像重建 (IR) 算法的快速发展,特别是一些基于 GAN 的模型的出现,现有的图像质量评估 (IQA) 方法已经无法很好地评估这些图像重…

MovieNet 电影理解数据集

MovieNet 是一个用于电影理解的数据集,包含 1100 部电影,其中具有大量多模态数据,例如预告片、照片、情节描述等。此外,MovieNet 中提供了不同方面的手动标注,包括 110w 个带有 bounding box 和身份标注的角色,4.2w 场景边界, 2,500 对…

AFLW-19 人脸对齐数据集

AFLW 全称 Annotated Facial Landmarks in the Wild,最初的 AFLW 数据集对于每张面部图像,都提供了最多 21 个特征点的标注(不含隐形 landmark),这增加了大多数现有 baseline 训练方法的难度。 AFLW-19 是对 …

WLD 动物目标检测数据集

WLD 全称 WildLife Documentary,是一个用于动物目标检测的数据集。该数据集包含从 YouTube 下载的 15 部纪录片,其时长从 9 分钟到长达 50 分钟不等,并且总帧数超过 747,000。该数据集标注了 65 个类别的 4,000 多个对象的轨迹。该…

CUFS 面部素描数据集

CUFS 全称 CUHK Face Sketch Database,是一个用于研究人脸素描合成和人脸素描识别。CUFS 数据集包含 606 张正常光照条件下中性表达的面部照片。其中,188 张来自香港中文大学学生数据库,123 张来自AR 人脸数据库,295 张来自 XM2VTS…

CUHK Image Cropping 图像裁剪数据集

CUHK Image Cropping 是一个用于图像裁剪的数据集。该数据集包含具有不同的美学风格的照片,涵盖各种图像类别,包括动物、建筑、人类、风景、夜景、植物和人造物体。每张图片由三位专业摄影师(以摄影为主要媒介的艺术研究生)手动裁剪,形成三个训练集。该数据集中包含 1,00…

ExpW 表情识别数据集

ExpW (Expression in-the-Wild) 是一个关于表情识别的数据集,可用于通过人脸图像判断社交关系。数据集包含 91,793 张手动标注表情的人脸图像,表情类别分为 7 种:angry, disgust, fear, happy,sad, surprise, …

CULane 车道检测数据集

这是一个用于交通车道检测的大规模数据集。数据通过安装在六辆不同汽车上的摄像头获取,这些汽车均行驶在北京街道,由不同司机驾驶。 该数据集包含了超过 55 小时的视频,从中提取出 133,235 帧。其中 88,880 张图像作为训练集,9,675 张图像作为验证集,34,680 张…