Ensemble De Données Vidéo d'occlusion Humaine 3D VOccl3D
Date
URL de publication
URL de l'article
VOccl3D est un ensemble de données synthétiques à grande échelle publié par l'Université de Californie en 2025, axé sur la compréhension humaine 3D dans des scènes complexes avec occlusion. L'article associé s'intitule « … »VOccl3D : un ensemble de données de référence vidéo pour l’estimation de la pose et de la forme humaines 3D en présence d’occlusions réellesL'objectif est de fournir un point de référence d'évaluation plus réaliste pour l'estimation, la reconstruction et les tâches de perception multimodale de la pose humaine, en fonction des conditions d'occlusion.
Cet ensemble de données contient plus de 250 000 images et environ 400 séquences vidéo, construites à partir de scènes d’arrière-plan, d’actions humaines et de textures diverses, notamment :
- Contexte : 40 représentations 3D du monde réel apprises à partir de DL3DV, incluant divers types d'occlusion naturelle.
- Mouvements humains : Environ 400 séquences de mouvements issues d’AMASS
- Textures corporelles : Environ 200 textures de SMPLitex, couvrant différents vêtements, teintes de peau et types de corps.
Toutes les séquences sont rendues à une résolution de 720×720 et à 30 images par seconde, ce qui permet d'obtenir des paramètres intrinsèques et extrinsèques précis de la caméra. L'ensemble de données comprend également des annotations multimodales, notamment la pose et la forme 3D, les points clés 2D, les contours humains, la segmentation sémantique, les étiquettes d'occlusion et les boîtes englobantes humaines, qui peuvent être utilisées pour étudier les capacités de perception humaine multitâches en conditions d'occlusion.

Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.