YCB-Video 物体位姿数据集

YCB-Video 数据集是一个用于 6D 物体姿态估计的大规模视频数据集。该数据集是在 PoseCNN 论文中贡献的,用来验证位姿估计中 symmetry,severe occlusions 等问题。 该数据集提供了来自 YCB 数据集的 21 个物体的精确 6D 姿势,这些物…

FAT 目标检测数据集

FAT 全称 Falling Things,可用于进一步改善机器人领域中的目标检测和 3D 姿态估计技术。该数据集包含对图像中的所有对象生成具有精确三维姿态标注的逼真图像。 该数据集包含来自 YCB 数据集中 21 个日常对象的 6 万张带标注照片。对于每张图像,该数据集为所有对…

NVGesture 手势识别数据集

NVGesture数据集可用于非接触式驾驶控制。该数据集包含 1,532 个动态手势,涉及 25 个类别。 该数据集包括 1,050 个用于训练的样本和 482 个用于测试的样本。视频以三种形式(RGB、深度和红外线)被记录。

DexYCB 手部姿态估计数据集

DexYCB 是一个人手抓取物体的数据集,可用于 2D 目标及关键点检测、6D 目标姿态估计以及 3D 手部姿态估计等任务中。 数据由 8 个 RGB-D 摄像头获取,以 30fps 记录了 8 个视角的 RGB 图片和深度图,分辨率为 640*480。总共记录了超过 1000 …

MetFaces 人脸图像数据集

MetFaces 是一个从艺术作品中提取的人脸图像数据集。该数据集由 1336 幅分辨率为 1024 × 1024 的高质量 PNG 图像组成。这些图像通过大都会艺术博物馆 Collection API 下载,并用 dlib 进行自动对齐和裁剪。同时又使用各种自动过滤器进行数据集…

REDS 现实和动态场景数据集

REDS 全称 The REalistic and Diverse Scenes,是一个提供了现实和动态场景的数据集,可用于视频去模糊和超分辨率。 该数据集由 300 个分辨率为 720 × 1,280 的视频序列组成,每个视频有 100 帧,其中训练集、验证集和测试集分别有 2…