Zur genauen Vorhersage menschlicher Bewegungen durch iterative Verbesserung

Die Vorhersage menschlicher Bewegungen zielt darauf ab, eine zukünftige Pose-Sequenz basierend auf einer vergangenen menschlichen Bewegungstrajektorie vorherzusagen. Um dieses Problem anzugehen, schlagen wir in dieser Arbeit FreqMRN vor, einen Rahmen für die Vorhersage menschlicher Bewegungen, der sowohl die kinematische Struktur des menschlichen Körpers als auch die zeitliche Glätte der Bewegung berücksichtigt. Konkret generiert FreqMRN zunächst eine feste, bewegungsgeschichtliche Zusammenfassung mit einer Bewegungs-Attention-Modul, wodurch ungenaue Vorhersagen infolge übermäßig langer Eingabebewegungen vermieden werden. Anschließend verfeinert FreqMRN iterativ die vorhergesagte Bewegung mittels eines vorgeschlagenen Bewegungsverfeinerungsmoduls, das Bewegungsrepräsentationen zwischen Pose-Raum und Frequenzraum hin- und herkonvertiert. Die Verfeinerung erfolgt unter Aufsicht durch verfügbare, räumlich-zeitlich bewusste, Geschwindigkeits-bewusste und global-glätte-bewusste Verlustfunktionen. Wir evaluieren FreqMRN an mehreren Standard-Benchmark-Datensätzen, darunter Human3.6M, AMASS und 3DPW. Experimentelle Ergebnisse zeigen, dass FreqMRN sowohl für kurzfristige als auch langfristige Vorhersagen deutlich gegenüber früheren Methoden übertrifft und darüber hinaus eine überlegene Robustheit aufweist.