HyperAIHyperAI
vor 2 Monaten

Einstufige Mehrpersonen-Pose-Maschinen

Xuecheng Nie; Jianfeng Zhang; Shuicheng Yan; Jiashi Feng
Einstufige Mehrpersonen-Pose-Maschinen
Abstract

Die Schätzung von Mehrpersonen-Posen ist ein anspruchsvolles Problem. Bestehende Methoden basieren in der Regel auf einem zweistufigen Ansatz – einer Stufe zur Erzeugung von Vorschlägen und einer anderen zur Zuordnung von Posen zu den entsprechenden Personen. Allerdings leiden solche zweistufigen Methoden in der Regel an geringer Effizienz. In dieser Arbeit präsentieren wir das erste einstufige Modell, die Single-stage Multi-Person Pose Machine (SPM), um den Prozess zu vereinfachen und die Effizienz bei der Schätzung von Mehrpersonen-Posen zu steigern. Um dies zu erreichen, schlagen wir eine neuartige Strukturierte Pose-Darstellung (SPR) vor, die die Darstellungen von Personinstanzen und Körperteilpositionen vereint. Auf Basis der SPR entwickeln wir das SPM-Modell, das strukturierte Posen für mehrere Personen in einer einzigen Stufe direkt vorhersagen kann und somit einen kompakteren Prozess und einen attraktiven Effizienzvorteil gegenüber zweistufigen Methoden bietet. Insbesondere führt SPR Wurzelgelenke ein, um verschiedene Personinstanzen zu kennzeichnen, während die Positionen menschlicher Körperteile als Verschiebungen relativ zu diesen Wurzelgelenken kodiert werden. Um bessere Vorhersagen für langreichweitige Verschiebungen bestimmter Gelenke zu ermöglichen, wird SPR auf hierarchische Darstellungen erweitert. Basierend auf SPR kann SPM durch gleichzeitige Vorhersage von Wurzelgelenken (Instanzstandort) und Körperteilverchiebungen mittels CNNs effizient Mehrpersonen-Pose-Schätzungen durchführen. Darüber hinaus demonstrieren wir die Allgemeingültigkeit der SPM auch bei der Schätzung von Mehrpersonen-3D-Posen. Ausführliche Experimente auf Benchmarks wie MPII, erweitertem PASCAL-Person-Part, MSCOCO und CMU Panoptic zeigen deutlich den Stand-des-Denkens-Effizienzvorteil der SPM bei der Schätzung von Mehrpersonen-2D/3D-Posen, verbunden mit herausragender Genauigkeit.