VOccl3D 3D ヒューマンオクルージョンビデオデータセット
VOccl3Dは、カリフォルニア大学が2025年に公開した大規模な合成データセットであり、複雑な遮蔽シーンにおける3D人間の理解に焦点を当てています。関連論文は「VOccl3D: 実際の遮蔽下での3D人間の姿勢と形状の推定のためのビデオベンチマークデータセット目標は、遮蔽条件に基づいて、人間の姿勢推定、再構築、およびマルチモーダル知覚タスクに対して、より現実的な評価ベンチマークを提供することです。
このデータセットには、背景シーン、人間の行動、さまざまなテクスチャから構築された 250,000 枚を超える画像と約 400 のビデオ シーケンスが含まれており、具体的には次のものが含まれます。
- 背景: さまざまな種類の自然な遮蔽を含む、DL3DV から学習した 40 の現実世界の 3D 表現。
- 人間の動作: AMASSからの約400のモーションシーケンス
- ボディ テクスチャ: さまざまな衣服、肌の色合い、体型を網羅する、SMPLitex の約 200 種類のテクスチャ。
すべてのシーケンスは720×720の解像度、30fpsでレンダリングされ、カメラの正確な内部パラメータと外部パラメータを提供します。データセットには、3Dポーズと形状、2Dキーポイント、人間の輪郭、セマンティックセグメンテーション、オクルージョンラベル、人間のバウンディングボックスなどのマルチモーダルアノテーションも含まれており、オクルージョン環境下における人間のマルチタスク知覚能力の研究に使用できます。
