VOccl3D 3D-Videodatensatz Zur Menschlichen Verdeckung
Datum
Veröffentlichungs-URL
Paper-URL
VOccl3D ist ein umfangreicher synthetischer Datensatz, der 2025 von der University of California veröffentlicht wurde und sich auf das dreidimensionale menschliche Verständnis in komplexen, verdeckten Szenen konzentriert. Die zugehörige Veröffentlichung trägt den Titel „VOccl3D: Ein Video-Benchmark-Datensatz zur 3D-Schätzung von menschlicher Pose und Form unter realen VerdeckungenZiel ist es, einen realistischeren Bewertungsmaßstab für Aufgaben der Schätzung, Rekonstruktion und multimodalen Wahrnehmung der menschlichen Körperhaltung auf Basis von Verdeckungsbedingungen bereitzustellen.
Dieser Datensatz enthält über 250.000 Bilder und etwa 400 Videosequenzen, die aus Hintergrundszenen, menschlichen Handlungen und verschiedenen Texturen zusammengesetzt sind, insbesondere:
- Hintergrund: 40 realweltliche 3D-Darstellungen, die aus DL3DV gelernt wurden, einschließlich verschiedener Arten von natürlicher Verdeckung.
- Menschliche Bewegung: Ungefähr 400 Bewegungssequenzen aus AMASS
- Körpertexturen: Ungefähr 200 Texturen von SMPLitex, die verschiedene Kleidungsstücke, Hauttöne und Körpertypen abdecken.
Alle Sequenzen werden mit einer Auflösung von 720×720 Pixeln und 30 Bildern pro Sekunde gerendert, wodurch präzise intrinsische und extrinsische Kameraparameter erfasst werden. Der Datensatz enthält zudem multimodale Annotationen, darunter 3D-Pose und -Form, 2D-Schlüsselpunkte, Konturen von Personen, semantische Segmentierung, Verdeckungsbezeichnungen und Begrenzungsrahmen. Diese können genutzt werden, um die Fähigkeit des Menschen zur gleichzeitigen Ausführung mehrerer Aufgaben unter Verdeckungsbedingungen zu untersuchen.

KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.