HyperAIHyperAI

Command Palette

Search for a command to run...

Graphbasierte 3D-Multi-Person-Pose-Schätzung unter Verwendung von Multiview-Bildern

Size Wu Sheng Jin Wentao Liu Lei Bai Chen Qian Dong Liu Wanli Ouyang

Zusammenfassung

Diese Arbeit untersucht die Aufgabe der Schätzung der 3D-Gesten mehrerer Personen aus mehreren kalibrierten Kamerasichtweisen. Im Anschluss an das Top-Down-Paradigma zerlegen wir die Aufgabe in zwei Stufen: Personenlokalisierung und Geste-Schätzung. Beide Stufen werden in einer grob-zu-fein-Methode bearbeitet. Wir schlagen drei auf die jeweilige Aufgabe zugeschnittene Graph-Neuronale Netze zur effektiven Nachrichtenübertragung vor. Für die 3D-Personenlokalisierung verwenden wir zunächst das Multi-view Matching Graph Modul (MMG), um die Assoziation über verschiedene Sichtweisen zu lernen und rohe Personen-Vorschläge zu rekonstruieren. Das Center Refinement Graph Modul (CRG) verfeinert die Ergebnisse anschließend über eine flexible punktbasierte Vorhersage. Für die 3D-Gestenschätzung lernt das Pose Regression Graph Modul (PRG) sowohl die mehransichtige Geometrie als auch die strukturellen Beziehungen zwischen den menschlichen Gelenken. Unser Ansatz erreicht eine state-of-the-art-Leistung auf den Datensätzen CMU Panoptic und Shelf bei signifikant geringerem Rechenaufwand.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp