EPIC-KITCHENS-55 厨房短视频数据集

EPIC-KITCHENS-55 是一个有关于厨房内活动短视频的数据集。该数据集包括在厨房开展与烹饪、食物准备或洗碗等有关的活动视频,且视频没有指导脚本。数据集包含 32 名参与者在厨房里以 60fps 的速度录制的 432 个第一视角的视频(配有头部摄像头)。 每个视频都分为简…

SHREC 3D 姿态捕捉数据集

SHREC 全称 SHape REtrieval Contes,是一个 3D 姿态捕捉数据集。数据集包含由 28 名参与者(全部为右撇子)完成的 14 个动态姿势,每个姿势由参与者用两种方式(仅用一根手指 & 使用整个手)做 1-10 次。 数据集由 2,800 个序列组…

EgoHands 手部复杂活动识别数据集

EgoHands 是一个识别复杂的手部动作的数据集。数据集包含 48 个谷歌眼镜视频,其中包含两个人之间复杂的第一人称互动。数据集的主要目的是能够在第一人称电脑影像中用更好的,数据驱动的的方式理解手部动作,可以从语义上区分观察者的手和其他人的手,以及区分左手和右手。演员自由参与一…

EgoGesture 手势识别数据集

EgoGesture 是一个大规模识别手势的数据集。该数据集规模大、富于变化且具有极高真实性,能够训练深度神经网络。数据集用于以自我为中心的手势识别。该数据集不仅为分段数据中的手势分类提供测试台,还用于连续数据中的手势检测。 数据集包括: 2,081 个 RGB-D 视频2,41…

Ego4D 第一视角视频数据集

Ego4D 是一个大规模的第一视角视频数据集。该数据集包含超过 3,025 个小时的视频,由来自 9 个国家的 73 个不同地点录制的视频组成,总录制人数达 855 人。 Ego4D 是目前最大的第一视角日常活动视频数据集。一些镜头还包括音频、有关参与者注视焦点位置的数据以及同一…

GolfDB 高尔夫挥杆测序数据集

GolfDB 是一个高质量的视频数据集,是为高尔夫运动中的常规识别应用而创建的,用于高尔夫挥杆定序任务。该数据集包含 1,400 个高质量的高尔夫挥杆视频,每个视频都标注有事件帧、边界框、球员姓名和性别、球杆类型和视图类型。

Composable activities dataset 动作识别数据集

Composable activities dataset 由 693 个视频组成,这些视频包含了由 14 个演员表演的 16 类活动。每个活动由 3 到 11 个原子动作 (atomic actions) 组成。每个序列的 RGB-D 数据是用 Microsoft Kinect…

Bimanual Actions Dataset 动作识别数据集

Bimanual Actions Dataset 是一个由 540 个 RGB-D 视频组成的数据集,展示了参与者在厨房或车间背景下进行的双手动作。该数据集旨在研究人类的双臂行为,以便最终提高仿人机器人的能力。

QUVA Repetition 重复动作视频数据集

QUVA Repetition 包含了真实的带有重复动作的视频,例如:游泳、搅拌、切割、梳理和音乐制作。所有视频都带有单独的循环界限和总重复次数的标注。该数据集同时包含了遮挡,相机移动,重复动作的速度变化。

MultiSports 时空行为检测数据集

MultiSports 是一个时空行为检测数据集。该数据集具有以下特征: 多人场景:在同一场景下,不同的人做不同的细粒度动作,减少背景提供的信息。动作边界定义准确。相对精细的细粒度动作类别。 通过选择 4 个运动类别,该数据集收集了 3,200 个视频片段,构建 MultiSpo…

EVE 眼动追踪数据集

EVE 全称 End-to-end Video-based Eye-tracking,是一个用于眼动追踪的数据集。该数据集收集自 54 名参与者,包括 4 个摄像头视图,包含超过 1,200 万帧的约 105 小时的视频数据,涵盖 1,327 个独特的视觉刺激(图像、视频、文本)…

Gait3D 大规模步态识别数据集

Gait3D 是一个基于 3D 表示的大规模步态识别数据集。该数据集采集自一个无约束的真实室内场景中的 39 个摄像头,包含 4,000 个受试者和超过 25,000 个序列。此外,该数据集提供了从视频帧中恢复的 3D SMPL数据,可支持密集人体体型、三维视角和步态动态信息的三…

GTA-IM 3D 人类场景交互数据集

GTA-IM 全称 GTA Indoor Motion,是 GTA 游戏引擎从 Grand Theft Auto (GTA) 视频游戏中收集的 GTA 室内运动数据集。该数据集具有清晰的 3D 人体姿势和相机位置标注,并且在人的外观,室内环境,相机视图和人类活动方面有很大的差异。…

MuCo-3DHP 多人 3D 姿态估计数据集

MuCo-3DHP 是一个预测多人 3D 姿态的数据集。该数据集使用了新颖的遮挡修复姿势图 (ORPM),即使在严重遮挡的情况下,也能进行全身的姿态估计。数据集包含复杂的多人互动和遮挡关系的真实图像。

CAD-120 人类活动视频数据集

CAD-120 是一个人类活动 RGB-D 视频序列数据集,这些视频序列由微软 Kinect 传感器记录,包含了 4 名受试者、进行 12 种活动的 120 个视频, 这些活动在不同的环境中进行,如厨房、客厅、办公室等。 该数据集可在人类活动检测机器上测试,旨在探索人类活动在机器…