HyperAIHyperAI
vor 2 Monaten

Zu einer viewinvarianten 3D-Pose-Schätzung von Menschen

Albert Haque; Boya Peng; Zelun Luo; Alexandre Alahi; Serena Yeung; Li Fei-Fei
Zu einer viewinvarianten 3D-Pose-Schätzung von Menschen
Abstract

Wir schlagen ein view-invariantes Modell für die 3D-Pose-Schätzung von Menschen aus einem einzelnen Tiefenbild vor. Um dies zu erreichen, kodiert unser diskriminatives Modell lokale Bereiche in einen gelernten view-invarianten Merkmalsraum. Als Multi-Task-Lernproblem formuliert, ist unser Modell in der Lage, selektiv partielle Posen bei Vorliegen von Rauschen und Verdeckungen zuvorzusagen. Unser Ansatz nutzt eine konvolutive und rekurrente Netzarchitektur mit einem top-down Fehlerrückkopplungsmechanismus, um die vorherigen Pose-Schätzungen auf end-to-end-Basis selbstkorrigieren zu können. Wir evaluieren unser Modell anhand eines bereits veröffentlichten Tiefendatensatzes sowie eines neu erstellten Datensatzes zur menschlichen Pose, der 100.000 annotierte Tiefenbilder aus extremen Blickwinkeln enthält. Experimente zeigen, dass unser Modell wettbewerbsfähige Ergebnisse bei frontal angeordneten Ansichten erzielt und gleichzeitig den Stand der Technik bei alternativen Blickwinkeln übertreffen kann.

Zu einer viewinvarianten 3D-Pose-Schätzung von Menschen | Neueste Forschungsarbeiten | HyperAI