Command Palette
Search for a command to run...
MSR-GCN: Multi-Scale Residual Graph Convolution Networks für die Vorhersage menschlicher Bewegungen
MSR-GCN: Multi-Scale Residual Graph Convolution Networks für die Vorhersage menschlicher Bewegungen
Lingwei Dang Yongwei Nie Chengjiang Long Qing Zhang Guiqing Li
Zusammenfassung
Die Vorhersage menschlicher Bewegungen ist aufgrund der stochastischen und aperiodischen Natur zukünftiger Pose-Positionen eine anspruchsvolle Aufgabe. In jüngster Zeit hat sich gezeigt, dass Graphen-Convolutional Networks (GCNs) äußerst effektiv sind, um dynamische Beziehungen zwischen Gelenken einer menschlichen Pose zu lernen, was die Pose-Vorhersage erheblich unterstützt. Andererseits lässt sich eine menschliche Pose rekursiv abstrahieren, um eine Reihe von Poses auf mehreren Skalen zu erhalten. Mit zunehmender Abstraktionsebene wird die Bewegung der Pose stabiler, was ebenfalls der Vorhersage zugutekommt. In diesem Artikel stellen wir ein neuartiges Multi-Scale Residual Graph Convolutional Network (MSR-GCN) für die Aufgabe der menschlichen Pose-Vorhersage im end-to-end-Modus vor. Die GCNs extrahieren zunächst Merkmale von fein bis grob und anschließend von grob bis fein. Die extrahierten Merkmale auf jeder Skala werden dann kombiniert und decodiert, um die Residuen zwischen der Eingabe- und der Ziel-Pose zu ermitteln. Zwischensupervisionen werden auf allen vorhergesagten Poses angewendet, was das Netzwerk dazu zwingt, repräsentativere Merkmale zu lernen. Unser vorgeschlagenes Verfahren wird auf zwei etablierten Benchmark-Datensätzen evaluiert, nämlich dem Human3.6M-Datensatz und dem CMU Mocap-Datensatz. Experimentelle Ergebnisse zeigen, dass unsere Methode die der aktuellen State-of-the-Art-Verfahren übertrifft. Der Quellcode und vortrainierte Modelle sind unter https://github.com/Droliven/MSRGCN verfügbar.