Generative Partition Networks für die Mehrpersonen-Pose-Schätzung

Dieses Papier schlägt ein neues Generatives Partitionierungsnetzwerk (GPN) vor, um das anspruchsvolle Problem der Mehrpersonen-Pose-Schätzung anzugehen. Im Gegensatz zu bestehenden Modellen, die entweder vollständig top-down oder bottom-up sind, führt das vorgeschlagene GPN eine neuartige Strategie ein – es erzeugt Partitionen für mehrere Personen aus ihren globalen Gelenkkandidaten und inferiert gleichzeitig instanzspezifische Gelenkkonfigurationen. Das GPN zeichnet sich durch eine geringe Komplexität und hohe Genauigkeit bei der Erkennung und Neuaufstellung von Gelenken aus. Insbesondere entwickelt das GPN ein generatives Modell, das einen einzigen Feedforward-Durchgang durchführt, um effizient robuste Personenerkennungen mit Gelenkpartitionen zu erzeugen, wobei es auf dichten Regressionen von globalen Gelenkkandidaten in einem Einbettungsraum basiert, der durch die Schwerpunkte der Personen parametrisiert ist. Darüber hinaus formuliert das GPN den Inferenzprozess für die Gelenkkonfigurationen menschlicher Poses als ein Graph-Partitionierungsproblem und führt eine lokale Optimierung für jede Personenerkennung unter Verwendung verlässlicher globaler Affinitätsinformationen durch. Dies führt zu einer Reduktion der Komplexität und einer Verbesserung der Leistung. Das GPN wird mit der Hourglass-Architektur als Backbon-Netzwerk implementiert, um gleichzeitig einen Gelenkerkennungsdetektor und einen dichten Regressor zu trainieren. Ausführliche Experimente auf Benchmarks wie MPII Human Pose Multi-Person, erweitertem PASCAL-Person-Part und WAF zeigen die Effizienz des GPN mit neuen Stand-von-der-Kunst-Leistungen.