vor 2 Monaten
MetaPose: Schnelle 3D-Pose aus mehreren Ansichten ohne 3D-Überwachung
Ben Usman; Andrea Tagliasacchi; Kate Saenko; Avneesh Sud

Abstract
Im Zeitalter des Deep Learnings hat die Schätzung der menschlichen Körperhaltung aus mehreren Kameras mit unbekannter Kalibrierung bislang wenig Aufmerksamkeit erfahren. Wir zeigen, wie man ein neuronales Modell trainieren kann, um diese Aufgabe mit hoher Genauigkeit und minimalem Latenzoverhead zu erfüllen. Das vorgeschlagene Modell berücksichtigt die Unsicherheit der Gelenkpositionen aufgrund von Verdeckungen aus mehreren Sichten und benötigt für das Training nur 2D-Schlüsselpunktdaten. Unsere Methode übertrifft sowohl klassische Bundle-Adjustment-Verfahren als auch schwach überwachte monokulare 3D-Baselines im etablierten Human3.6M-Datensatz sowie im anspruchsvolleren in-the-wild Ski-Pose PTZ-Datensatz.