HyperAIHyperAI

Command Palette

Search for a command to run...

Robuste Schätzung von 3D-Menschenpose aus einem einzelnen Bild

Chunyu Wang; Yizhou Wang; Zhouchen Lin; Alan L. Yuille; Wen Gao

Zusammenfassung

Die Schätzung der menschlichen Pose ist ein wesentlicher Schritt zur Aktionserkennung. Wir schlagen eine Methode vor, um 3D-Posen aus einem einzelnen Bild zu schätzen, die zusammen mit einem bestehenden 2D-Pose-/Gelenkerkennungsmodul arbeitet. Die Schätzung von 3D-Posen ist herausfordernd, da mehrere 3D-Posen nach Projektion aufgrund des Mangels an Tiefeninformation derselben 2D-Pose entsprechen können. Darüber hinaus sind aktuelle 2D-Pose-Schätzer in der Regel ungenau, was zu Fehlern in der 3D-Schätzung führen kann. Wir gehen diesen Herausforderungen auf drei Wegen entgegen: (i) Wir repräsentieren eine 3D-Pose als lineare Kombination einer dünnbesetzten Menge von Basen, die aus 3D-Menschenskeletten gelernt wurden. (ii) Wir erzwingen Gliedmaßenlängenbeschränkungen, um anthropomorph unplausible Skelette zu eliminieren. (iii) Wir schätzen eine 3D-Pose, indem wir den L1L_1L1-Norm-Fehler zwischen der Projektion der 3D-Pose und der entsprechenden 2D-Erkennung minimieren. Der L1L_1L1-Norm-Verlustterm ist robust gegenüber ungenauen 2D-Gelenkpunktschätzungen. Wir verwenden die Methode der alternierenden Richtungen (ADM), um das Optimierungsproblem effizient zu lösen. Unser Ansatz übertrifft den Stand der Technik in drei Benchmark-Datensätzen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp