HyperAIHyperAI

Command Palette

Search for a command to run...

Zu einer viewinvarianten 3D-Pose-Schätzung von Menschen

Albert Haque Boya Peng* Zelun Luo* Alexandre Alahi Serena Yeung Li Fei-Fei

Zusammenfassung

Wir schlagen ein view-invariantes Modell für die 3D-Pose-Schätzung von Menschen aus einem einzelnen Tiefenbild vor. Um dies zu erreichen, kodiert unser diskriminatives Modell lokale Bereiche in einen gelernten view-invarianten Merkmalsraum. Als Multi-Task-Lernproblem formuliert, ist unser Modell in der Lage, selektiv partielle Posen bei Vorliegen von Rauschen und Verdeckungen zuvorzusagen. Unser Ansatz nutzt eine konvolutive und rekurrente Netzarchitektur mit einem top-down Fehlerrückkopplungsmechanismus, um die vorherigen Pose-Schätzungen auf end-to-end-Basis selbstkorrigieren zu können. Wir evaluieren unser Modell anhand eines bereits veröffentlichten Tiefendatensatzes sowie eines neu erstellten Datensatzes zur menschlichen Pose, der 100.000 annotierte Tiefenbilder aus extremen Blickwinkeln enthält. Experimente zeigen, dass unser Modell wettbewerbsfähige Ergebnisse bei frontal angeordneten Ansichten erzielt und gleichzeitig den Stand der Technik bei alternativen Blickwinkeln übertreffen kann.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Zu einer viewinvarianten 3D-Pose-Schätzung von Menschen | Paper | HyperAI