HyperAIHyperAI
vor einem Monat

Semantische Graph-Faltungsnetze für die 3D-Pose-Regression von Menschen

Long Zhao; Xi Peng; Yu Tian; Mubbasir Kapadia; Dimitris N. Metaxas
Semantische Graph-Faltungsnetze für die 3D-Pose-Regression von Menschen
Abstract

In dieser Arbeit untersuchen wir das Problem des Lernens von Graph Convolutional Networks (GCNs) für Regressionsaufgaben. Die aktuellen Architekturen von GCNs sind auf den kleinen Rezeptionsbereich der Faltungsfiltre und die gemeinsame Transformationsmatrix für jeden Knoten begrenzt. Um diese Einschränkungen zu überwinden, schlagen wir Semantic Graph Convolutional Networks (SemGCN) vor, eine neuartige neuronale Netzwerkarchitektur, die auf Regressionsaufgaben mit graphstrukturierten Daten operiert. SemGCN lernt, semantische Informationen wie lokale und globale Knotenbeziehungen zu erfassen, die im Graph nicht explizit dargestellt sind. Diese semantischen Beziehungen können durch end-to-end Training aus der Grundwahrheit gelernt werden, ohne zusätzliche Überwachung oder manuell erstellte Regeln. Wir untersuchen ferner die Anwendung von SemGCN auf die 3D-Pose-Regression von Menschen. Unsere Formulierung ist intuitiv und ausreichend, da sowohl 2D- als auch 3D-Menschposes als strukturierter Graph repräsentiert werden können, der die Beziehungen zwischen den Gelenken im Skelett eines menschlichen Körpers kodiert. Wir führen umfassende Studien durch, um unsere Methode zu validieren. Die Ergebnisse zeigen, dass SemGCN den Stand der Technik bei gleichzeitiger Verwendung von 90 % weniger Parametern übertrifft.