HyperAIHyperAI
vor 2 Monaten

Mehrere Hypothesen zur 3D-Pose-Schätzung von Menschen begünstigen fehlerhaft kalibrierte Verteilungen

Pierzchlewicz, Paweł A. ; Cotton, R. James ; Bashiri, Mohammad ; Sinz, Fabian H.
Mehrere Hypothesen zur 3D-Pose-Schätzung von Menschen begünstigen fehlerhaft kalibrierte Verteilungen
Abstract

Aufgrund von Tiefenunsicherheiten und Verdeckungen ist die Umwandlung von 2D-Posen in 3D ein hochgradig schlecht gestelltes Problem. Gut kalibrierte Verteilungen möglicher Posen können diese Unsicherheiten explizit machen und die resultierende Unsicherheit für nachgelagerte Aufgaben bewahren. Diese Studie zeigt, dass frühere Ansätze, die durch die Generierung mehrerer Hypothesen diese Unsicherheiten berücksichtigen, fehlerhaft kalibrierte Verteilungen erzeugen. Wir identifizieren, dass Fehlkalibrierung auf die Verwendung stichprobenbasierter Metriken wie minMPJPE zurückgeführt werden kann. In einer Reihe von Simulationen zeigen wir, dass das Minimieren von minMPJPE, wie es üblich ist, zur korrekten Mittelwertsprädiktion konvergieren sollte. Es scheitert jedoch daran, die Unsicherheit korrekt zu erfassen, was zu einer fehlerhaft kalibrierten Verteilung führt. Um dieses Problem zu mildern, schlagen wir ein präzises und gut kalibriertes Modell vor, das Conditional Graph Normalizing Flow (cGNFs) genannt wird. Unser Modell ist so strukturiert, dass ein einzelnes cGNF sowohl bedingte als auch marginale Dichten innerhalb desselben Modells schätzen kann – effektiv löst es damit ein Zero-Shot-Dichte-Schätzungsproblem. Wir evaluieren cGNF am Datensatz Human~3.6M und zeigen, dass cGNF eine gut kalibrierte Dichteschätzung liefert und gleichzeitig nahe an den Stand der Technik in Bezug auf den gesamten minMPJPE liegt. Darüber hinaus übertrifft cGNF frühere Methoden bei verdeckten Gelenken und bleibt dabei gut kalibriert.