FFHQ-Aging 年龄图像数据集

FFHQ 全称 Flickr-Faces-High-Quality。FFHQ-Aging 是一个人脸数据集,旨在为年龄转换算法以及相关视觉任务提供 benchmark。它是 NVIDIA FFHQ 数据集的延伸,在 7 万张原始 FFHQ 图像的基础上增加了更多信息。 图像增加信…

PhotoShape 逼真 3D 形状图像数据集

PhotoShape 全称 Photorealistic Shape,是带有逼真外观模样的 3D 形状图像数据集。图像是由作者设计的系统合成。系统对真实照片中的材料进行分类,并利用 3D-2D 对齐技术将材料转移到每个形状的不同部位,进而合成效果图。其中 Herman Mille…

MusicNet 音乐数据集

MusicNet 是一个大型音乐数据集,用以监督和评估音乐研究的机器学习方法。该数据集由 330 张版权免费的古典音乐唱片以及超100万个注释标签组成。注明了每张唱片每个音符出现的准确时间、演奏该音符的乐器以及该音符在作品韵律结构中的位置。这些标签经由音乐家评估验证,得出标签的错…

CRUW 雷达目标检测数据集

CRUW 是一个用于雷达目标检测 (radar object detection) 任务的数据集。该数据集包含基于雷达数据的系统性标注和评估系统,其中涉及在各种驾驶场景中收集的 RGB 图像和雷达射频图像。

VCR 视觉常识推理数据集

VCR 全称 Visual Commonsense Reasoning,是一个用于视觉常识推理的大规模数据集。该数据集提出了关于图像的具有挑战性的问题,机器需要完成两个子任务:正确回答问题以及提供理由证明其答案的合理性。 VCR 数据集包含大量问题,其中 212K 个用于训练,2…

MPI Sintel 光流评估图像数据集

MPI (Max Planck Institute) Sintel 是一个用于光流评估的数据集,包含了 1,064 个合成立体图像和用于视差的 ground-truth 数据。Sintel 数据来自开源 3D 动画短片《Sintel》。该数据集有 23 个不同的场景,立体图像为 …