RHD 全称 Rendered Hand Pose,是一个关于手势估计的图像数据集。该数据集包含了 41,258 个训练集和 2,728 个测试集。
每个 sample 提供:
- RGB 图像(320 X 320 像素)
- depth map(320 X 320 像素)
- class 的分割 mask(320 X 320 像素):人物、背景、每根手指的 3 个 class 以及每个手掌的 1 个 class
- 21 个手部关键点以及 image frame 中的 uv 坐标、 world frame 中的 xyz 坐标以及一个可见度 indicator
- intrinsic camera matrix K