DHP19 人体姿态估计数据集

DHP19 是一个从DVS 事件相机搜集的 3D 人体姿态的数据集。该数据集使用 4 个不同位置的事件相机,每个不同位置的事件相机的输出均被记录,同时使用运动捕捉系统得到人体运动的真实姿态。3D 坐标是从 Vicon 中提取的,而 2D 坐标是手动标注的。 该数据集记录了 17 …

UAVA 无人机数据集

UAVA 全称 UAV Assistant,该数据集将无人机视为在其操作中支持人类用户的合作代理,可用于相关应用程序的培训。UAVA 是一个真实的多模态数据集,其中包括以外中心的用户视图和以自我为中心的UAV视图。该数据集的生成使用了真实世界的 3D 扫描数据集 ( Matter…

PedX 3D 姿态估计数据集

PedX 数据集是一个大规模多模态数据集,是在复杂的城市交叉路口对行人进行采集的。 该数据集提供高分辨率的立体图像,以及带有手动添加的 2D 标注和自动添加的 3D 标注的 LiDAR 数据。此外,数据是使用两对立体相机和四个 Velodyne LiDAR 传感器进行的采集。

AGORA 姿态估计数据集

AGORA 全称 Avatars in Geography Optimized for Regression Analysis,是一个合成人类数据集,具有高真实度和非常准确的 ground truth。此数据集包括约 14k 张训练图像和 3k 张测试图像,使用基于图像的ligh…

AcinoSet 猎豹视频数据集

AcinoSet 是一个包含野外自由奔跑的猎豹的视频数据集,其中包含 119,490 帧多视图同步高速视频片段、相机校准文件和 7,588 个人工标注帧。作者利用 DeepLabCut 的无标注动物姿势估计来提供 2D 关键点。该数据集还包括 3D 轨迹、人工检查的 3D gro…

EgoCap 姿态估计数据集

EgoCap 全称 Egocentric Maker-less Motion Capture,是关于全身骨骼姿态估计的图像数据集,由 8 位穿着不同的受试者的 10 万张 egocentric 图像组成。其中 6 位受试者的 7.5 万张图像用于训练,2 位受试者的 2.5 万张…

MuCo-3DHP 多人 3D 姿态估计数据集

MuCo-3DHP 是一个预测多人 3D 姿态的数据集。该数据集使用了新颖的遮挡修复姿势图 (ORPM),即使在严重遮挡的情况下,也能进行全身的姿态估计。数据集包含复杂的多人互动和遮挡关系的真实图像。

G3D 动作识别数据集

G3D 全称 Gaming 3D Dataset,是一个游戏动作 3D 数据集。该数据集专注于游戏场景中的实时动作识别。它包含 10 个主题,执行 20 个游戏动作:“punch right”, “punch left”, “kick right”, “kick left”, “…

GraspNet-1Billion 物体抓取姿态检测数据集

GraspNet-1Billion 是关于物体抓取姿态检测的 RGB-D 图像数据集,包含 190 个复杂背景和 97,280 张图像,每张图像有精确的 6D 姿态标注和物体抓取姿态标注,共有 88 个物体和超过 11 亿个抓取姿态。这些图像由 Kinect Azure 和 Re…

HUMAN4D 姿态估计数据集

HUMAN4D 是关于姿态估计的大型多模态 4D 数据集,包含了由专业 marker-based MoCap、volumetric capture system 和 audio recording system 收集的各种人类活动。通过收集 2 名女演员和 2 名男演员的全身动作…

Aachen Day-Night 视觉定位数据集

Aachen Day-Night 是一个用于在不同条件下,对 6DOF 户外视觉定位进行基准测试的图像数据集。该数据集侧重于根据白天的 3D 模型定位夜间的高质量图像,共有 14,607 张图像,包括天气、季节和昼夜周期的变化情况。

UAV-Human 行为识别数据集

UAV-Human 是一个大规模人类行为理解数据集。该数据集由无人机获取,为期三个月,拍摄了多个城市及农村地区早晚期间的视频,包括了广泛的主题、背景、照明条件等。 该数据集包括 67,428 个多模态视频序列以及 119 个动作识别对象。其中 22,476 帧用于姿态估计,41,…

CrowdPose 多人姿态估计数据集

这是一个用于探讨在拥挤场景中的多人姿态估计的图像数据集。该数据集包括 2 万张图像和标注有 14 个关键点的 8 万个人体姿势,其中测试集包括 8,000 张图像。数据集中包含房屋的拥挤图像来源于三方面:MSCOCO、MPII 和 AI Challenger。

IKEA ASM 宜家家具组装数据集

IKEA ASM 是一个包含 300 万帧、多视图、家具组装视频数据集,其中包括深度、原子动作、对象分割和人体姿势。 背景方面,涉及 48 个装配工,5 个组装场景。 家具方面,涉及4 种家具 (side table, coffee table, TV bench, and dr…