Command Palette
Search for a command to run...
Einzelbildschätzung mehrerer Personen im 3D-Gelenkmodell aus monokularer RGB-Daten
Einzelbildschätzung mehrerer Personen im 3D-Gelenkmodell aus monokularer RGB-Daten
Zusammenfassung
Wir stellen eine neue Einzelschuss-Methode zur 3D-Pose-Schätzung mehrerer Personen in allgemeinen Szenen aus einer monokularen RGB-Kamera vor. Unser Ansatz nutzt neuartige, occlusionrobuste Pose-Maps (ORPM), die eine vollständige Körperpose-Inferenz auch bei starken partiellen Verdeckungen durch andere Personen und Objekte in der Szene ermöglichen. ORPM generiert eine feste Anzahl von Karten, die die 3D-Gelenkpositionen aller Personen in der Szene kodieren. Durch die Verwendung von Körperteil-Assoziationen kann die 3D-Pose einer beliebigen Anzahl von Personen geschätzt werden, ohne dass explizit Bounding-Box-Vorhersagen erforderlich sind. Zur Trainingsunterstützung führen wir MuCo-3DHP ein, die erste große Datensammlung mit realen Bildern komplexer Mehrpersonen-Interaktionen und Verdeckungen. Wir synthetisieren eine umfangreiche Menge an Mehrpersonen-Bildern, indem wir Bilder einzelner Personen (mit Ground-Truth aus Mehransichts-Performance-Capture) zusammensetzen. Wir evaluieren unsere Methode auf unserem neuen anspruchsvollen, 3D-annotierten Testdatensatz für Mehrpersonen-Muster MuPoTs-3D, auf dem wir einen state-of-the-art-Performance erzielen. Um die Forschung in der 3D-Pose-Schätzung mehrerer Personen weiter voranzutreiben, stellen wir unsere neuen Datensätze sowie den zugehörigen Code für Forschungszwecke öffentlich zur Verfügung.