HyperAIHyperAI

Command Palette

Search for a command to run...

VoxelPose: Hin zu der 3D-Menschenpose-Schätzung mit mehreren Kameras in wilden Umgebungen

Hanyue Tu Chunyu Wang Wenjun Zeng

Zusammenfassung

Wir präsentieren einen Ansatz zur Schätzung von 3D-Posen mehrerer Personen aus mehreren Kamerasichtweisen. Im Gegensatz zu früheren Ansätzen, die eine Kreuzsicht-Entsprechung basierend auf verrauschten und unvollständigen 2D-Pose-Schätzungen erfordern, bieten wir eine end-to-end-Lösung, die direkt im 3D-Raum operiert und somit fehlerhafte Entscheidungen im 2D-Raum vermeidet. Um dieses Ziel zu erreichen, werden die Merkmale aus allen Kamerasichten in einen gemeinsamen 3D-Raum transformiert und aggregiert und anschließend in das Cuboid Proposal Network (CPN) eingespeist, um alle Personen grob zu lokalisieren. Anschließend stellen wir das Pose Regression Network (PRN) vor, das eine detaillierte 3D-Pose für jede Vorschlagspose schätzt. Unser Ansatz ist robust gegenüber Verdeckung, die in der Praxis häufig auftritt. Ohne zusätzliche Komplexitäten erreicht er eine bessere Leistung als die derzeitigen State-of-the-Art-Methoden auf öffentlichen Datensätzen. Der Quellcode wird unter https://github.com/microsoft/multiperson-pose-estimation-pytorch veröffentlicht.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
VoxelPose: Hin zu der 3D-Menschenpose-Schätzung mit mehreren Kameras in wilden Umgebungen | Paper | HyperAI