HyperAIHyperAI
vor 16 Tagen

Mehrere menschliche 3D-Gesten-Schätzung aus Multiview-Bildern

{Shohreh Kasaei, Sara Ershadi-Nasab, Esmaeil Sanaei, Erfan Noury}
Abstract

Die Schätzung mehrerer menschlicher 3D-Posen ist eine herausfordernde Aufgabe. Dies liegt hauptsächlich an großen Variationen in Skalierung und Pose von Menschen, schnellen Bewegungen, mehreren Personen im Szenenbereich sowie einer beliebigen Anzahl sichtbarer Körperteile aufgrund von Verdeckung oder Abschnittsverlust. Einige dieser Unsicherheiten können durch den Einsatz mehrerer Ansichten adressiert werden, da in mehreren Perspektiven zusätzliche Beweise für Körperteile verfügbar sind. In dieser Arbeit wird ein neuartiges Verfahren zur Schätzung mehrerer menschlicher 3D-Posen unter Nutzung von Beweisen aus mehreren Ansichten vorgestellt. Das vorgeschlagene Verfahren nutzt ein vollständig verbundenes paarweises bedingtes Zufallsfeld (pairwise conditional random field), das zwei Arten von paarweisen Termen enthält. Der erste paarweise Term kodiert räumliche Abhängigkeiten zwischen menschlichen Gelenken basierend auf einer artikulierten menschlichen Körperkonfiguration. Der zweite paarweise Term basiert auf den Ausgaben eines 2D-Tiefen-Teil-Detektors. Anschließend wird eine approximative Inferenz mittels des Loopy Belief Propagation-Algorithmus durchgeführt. Das vorgeschlagene Verfahren wird anhand der Benchmarks Campus, Shelf, Utrecht Multi-Person Motion, Human3.6M, KTH Football II und MPII Cooking evaluiert. Experimentelle Ergebnisse zeigen, dass das vorgeschlagene Verfahren gegenüber bestehenden state-of-the-art-Methoden erhebliche Verbesserungen hinsichtlich der Wahrscheinlichkeit korrekter Pose sowie der mittleren Gelenkpositionsfehler erzielt.

Mehrere menschliche 3D-Gesten-Schätzung aus Multiview-Bildern | Neueste Forschungsarbeiten | HyperAI