Command Palette
Search for a command to run...
3D Human Pose Estimation mittels Möbius-Graph-Convolutional Networks
3D Human Pose Estimation mittels Möbius-Graph-Convolutional Networks
Niloofar Azizi Horst Possegger Emanuele Rodolà Horst Bischof
Zusammenfassung
Die 3D-Schätzung menschlicher Körperhaltung ist grundlegend für das Verständnis menschlichen Verhaltens. In jüngster Zeit wurden vielversprechende Ergebnisse durch Graph-Convolutional Networks (GCNs) erzielt, die eine state-of-the-art Leistung erzielen und gleichzeitig äußerst leichtgewichtige Architekturen bieten. Ein wesentlicher Nachteil von GCNs besteht jedoch darin, dass sie alle Transformationen zwischen Gelenken nicht explizit codieren können. Um dieses Problem anzugehen, schlagen wir ein neuartiges spektrales GCN-Modell vor, das die Möbius-Transformation nutzt (MöbiusGCN). Insbesondere ermöglicht dies eine direkte und explizite Codierung der Transformationen zwischen Gelenken, was zu einer erheblich kompakteren Darstellung führt. Im Vergleich zu selbst den leichtgewichtigsten Architekturen bisher benötigt unser Ansatz 90–98 % weniger Parameter – unser leichtestes MöbiusGCN verfügt lediglich über 0,042 M trainierbare Parameter. Neben der drastischen Reduktion der Parameterzahl ermöglicht die explizite Codierung der Gelenktransformationen zudem die Erreichung von state-of-the-art Ergebnissen. Wir evaluieren unseren Ansatz an zwei anspruchsvollen Benchmarks für Körperhaltungsschätzung, Human3.6M und MPI-INF-3DHP, wodurch sowohl state-of-the-art Leistungen als auch die Generalisierungsfähigkeit des MöbiusGCN nachgewiesen werden.