HyperAIHyperAI
vor 3 Monaten

Schrittweise Generierung besserer Ausgangsschätzungen für die nächsten Stadien zur hochwertigen Vorhersage menschlicher Bewegungen

Tiezheng Ma, Yongwei Nie, Chengjiang Long, Qing Zhang, Guiqing Li
Schrittweise Generierung besserer Ausgangsschätzungen für die nächsten Stadien zur hochwertigen Vorhersage menschlicher Bewegungen
Abstract

Diese Arbeit präsentiert eine hochwertige Methode zur Vorhersage menschlicher Bewegungen, die zukünftige Körperhaltungen präzise auf Basis beobachteter Haltungen vorhersagt. Unser Ansatz basiert auf der Beobachtung, dass eine gute Anfangsschätzung der zukünftigen Haltungen erheblich zur Verbesserung der Vorhersagegenauigkeit beiträgt. Dies motiviert uns, einen neuartigen zweistufigen Vorhersageansatz vorzuschlagen, der zunächst ein Init-Prediction-Netzwerk verwendet, das lediglich eine gute Schätzung generiert, gefolgt von einem formalen Vorhersage-Netzwerk, das die Zielhaltungen basierend auf dieser Schätzung vorhersagt. Noch wichtiger ist, dass wir diese Idee weiter ausbauen und einen mehrstufigen Vorhersageansatz entwerfen, bei dem jede Stufe eine Anfangsschätzung für die nächste Stufe bereitstellt, was zusätzliche Leistungssteigerungen ermöglicht. Um die Vorhersageaufgabe in jeder Stufe zu erfüllen, schlagen wir ein Netzwerk vor, das aus Spatial Dense Graph Convolutional Networks (S-DGCN) und Temporal Dense Graph Convolutional Networks (T-DGCN) besteht. Durch alternierendes Ausführen beider Netzwerke können globale räumlich-zeitliche Merkmale über den gesamten Rezeptivfeldbereich der gesamten Haltungssequenz effektiv extrahiert werden. Alle oben genannten Entwurfsentscheidungen, die gemeinsam wirken, ermöglichen es unserer Methode, die Leistung früherer Ansätze deutlich zu überbieten: um 6 % bis 7 % auf Human3.6M, um 5 % bis 10 % auf CMU-MoCap und um 13 % bis 16 % auf 3DPW.