VOccl3D 三维人体遮挡视频数据集
VOccl3D 是由加州大学于 2025 年发布的一个专注于复杂遮挡场景下人体三维理解的大规模合成数据集,相关论文成果为「VOccl3D: A Video Benchmark Dataset for 3D Human Pose and Shape Estimation under real Occlusions」,旨在为人体姿态估计、重建与多模态感知任务提供更贴近真实遮挡环境的评测基准。
该数据集共包含超过 25 万张图像和约 400 段视频序列,由背景场景、人类动作与多样化贴图共同构建,具体包括:
- 背景场景:40 个基于 DL3DV 学习得到的真实世界 3D 表征,包含多类自然遮挡物
- 人体动作:约 400 条来自 AMASS 的动作序列
- 人体贴图:约 200 组来自 SMPLitex 的纹理,覆盖不同服饰、肤色与体型
所有序列以 720×720 、 30 fps 渲染,并提供准确的相机内外参。该数据集还提供多模态标注,包括 3D 姿态与形状、 2D 关键点、人体轮廓、语义分割、遮挡标签与人体框,可用于研究遮挡条件下的多任务人体感知能力。
