HyperAIHyperAI
vor 12 Tagen

Mehrere menschliche Pose-Schätzung mit zeitlich konsistenten 3D-Bildstruktur

{Vasileios Belagiannis, Pascal Fua, Xinchao Wang, Slobodan Ilic, Nassir Navab, Bernt Schiele}
Abstract

Die Schätzung mehrerer menschlicher 3D-Gesten aus mehreren Kamerasichten ist eine anspruchsvolle Aufgabe in ungehinderten Umgebungen. Jede Person muss in jeder Kameraansicht zugeordnet werden, und anschließend muss die Körperhaltung geschätzt werden. Zudem ändert sich die Körperhaltung jeder Person über die Zeit konsistent. Um diesen Herausforderungen zu begegnen, schlagen wir ein zeitlich konsistentes 3D-Pictorial-Structures-Modell (3DPS) für die Schätzung mehrerer menschlicher Gesten aus mehreren Kamerasichten vor. Unser Modell basiert auf dem 3D-Pictorial-Structures-Modell und führt den Begriff der zeitlichen Konsistenz zwischen den geschätzten Körperhaltungen ein. Diese Eigenschaft leiten wir durch die Nutzung von Multi-View-Menschenverfolgung her. Die Identifizierung jeder Person vor der Schätzung reduziert signifikant die Größe des Zustandsraums und beeinflusst die Leistung positiv. Zur Evaluation unserer Methode verwenden wir zwei anspruchsvolle Datensätze mit mehreren Menschen in ungehinderten Umgebungen. Wir vergleichen unsere Methode mit aktuellen state-of-the-art-Ansätzen und erreichen dabei bessere Ergebnisse.

Mehrere menschliche Pose-Schätzung mit zeitlich konsistenten 3D-Bildstruktur | Neueste Forschungsarbeiten | HyperAI