HyperAIHyperAI
vor 16 Tagen

3D Pictorial Structures neu betrachtet: Mehrfache Schätzung menschlicher Pose

{Slobodan Ilic, Mykhaylo Andriluka, Vasileios Belagiannis, Nassir Navab, Sikandar Amin, Bernt Schiele}
Abstract

Wir behandeln das Problem der 3D-Pose-Schätzung mehrerer Menschen aus mehreren Ansichten. Der Übergang von der Einzel- zur Mehrfachmensch-Pose-Schätzung sowie von der 2D- zur 3D-Raumdarstellung ist herausfordernd, da der Zustandsraum erheblich größer wird, zudem durch Verdeckungen und sichtübergreifende Mehrdeutigkeiten gekennzeichnet ist, insbesondere wenn die Identität der Menschen im Voraus nicht bekannt ist. Um diese Probleme zu bewältigen, reduzieren wir zunächst den Zustandsraum durch Triangulation entsprechender Körperteil-Paare, die jeweils durch Körperteildetektoren für jede Kameraansicht ermittelt werden. Um Mehrdeutigkeiten infolge falscher oder vermischt erkannter Körperteile mehrerer Menschen nach der Triangulation sowie solche, die aus Falschpositiv-Detektionen resultieren, zu lösen, führen wir ein 3D-Pictorial-Structures-(3DPS)-Modell ein. Unser Modell basiert auf multi-view-einzelnen Potenzialen, während ein vorheriges Modell in die paarweisen und dreigliedrigen Potenzialfunktionen integriert wird. Um das Einflussgewicht der verschiedenen Potenziale auszugleichen, werden die Modellparameter mittels eines Structured Support Vector Machine (SSVM) gelernt. Das Modell ist generisch und eignet sich sowohl für die Einzel- als auch die Mehrfachmensch-Pose-Schätzung. Zur Evaluierung unseres Modells im Kontext der Einzel- und Mehrfachmensch-Pose-Schätzung nutzen wir vier verschiedene Datensätze. Zunächst analysieren wir den Beitrag der einzelnen Potenziale und vergleichen anschließend unsere Ergebnisse mit verwandten Arbeiten, wobei wir eine überlegene Leistung demonstrieren.

3D Pictorial Structures neu betrachtet: Mehrfache Schätzung menschlicher Pose | Neueste Forschungsarbeiten | HyperAI