HyperAIHyperAI
vor 4 Monaten

Robuste Schätzung von 3D-Menschenpose aus einem einzelnen Bild

Chunyu Wang; Yizhou Wang; Zhouchen Lin; Alan L. Yuille; Wen Gao
Robuste Schätzung von 3D-Menschenpose aus einem einzelnen Bild
Abstract

Die Schätzung der menschlichen Pose ist ein wesentlicher Schritt zur Aktionserkennung. Wir schlagen eine Methode vor, um 3D-Posen aus einem einzelnen Bild zu schätzen, die zusammen mit einem bestehenden 2D-Pose-/Gelenkerkennungsmodul arbeitet. Die Schätzung von 3D-Posen ist herausfordernd, da mehrere 3D-Posen nach Projektion aufgrund des Mangels an Tiefeninformation derselben 2D-Pose entsprechen können. Darüber hinaus sind aktuelle 2D-Pose-Schätzer in der Regel ungenau, was zu Fehlern in der 3D-Schätzung führen kann. Wir gehen diesen Herausforderungen auf drei Wegen entgegen: (i) Wir repräsentieren eine 3D-Pose als lineare Kombination einer dünnbesetzten Menge von Basen, die aus 3D-Menschenskeletten gelernt wurden. (ii) Wir erzwingen Gliedmaßenlängenbeschränkungen, um anthropomorph unplausible Skelette zu eliminieren. (iii) Wir schätzen eine 3D-Pose, indem wir den $L_1$-Norm-Fehler zwischen der Projektion der 3D-Pose und der entsprechenden 2D-Erkennung minimieren. Der $L_1$-Norm-Verlustterm ist robust gegenüber ungenauen 2D-Gelenkpunktschätzungen. Wir verwenden die Methode der alternierenden Richtungen (ADM), um das Optimierungsproblem effizient zu lösen. Unser Ansatz übertrifft den Stand der Technik in drei Benchmark-Datensätzen.

Robuste Schätzung von 3D-Menschenpose aus einem einzelnen Bild | Forschungsarbeiten | HyperAI