Generierung glatter Pose-Sequenzen für vielfältige menschliche Bewegungsvorhersage

Neuere Fortschritte in der stochastischen Bewegungsvorhersage – also der Vorhersage mehrerer möglicher zukünftiger menschlicher Bewegungsabläufe anhand einer einzigen vergangenen Pose-Sequenz – haben es ermöglicht, wirklich vielfältige zukünftige Bewegungen zu generieren und zudem die Bewegung bestimmter Körperteile steuern zu können. Um dies zu erreichen, erfordert die derzeit beste Methode jedoch das Lernen mehrerer Abbildungen zur Erzeugung von Vielfalt sowie eines speziellen Modells für steuerbare Bewegungsvorhersage. In diesem Paper stellen wir ein einheitliches tiefes generatives Netzwerk für sowohl vielfältige als auch steuerbare Bewegungsvorhersage vor. Hierzu nutzen wir die Intuition, dass realistische menschliche Bewegungen aus glatten Folgen gültiger Posen bestehen, und dass bei begrenzten Daten das Lernen einer Pose-Prior weitaus handhabbarer ist als das Lernen einer gesamten Bewegungsprior. Daher entwerfen wir einen Generator, der die Bewegung verschiedener Körperteile sequenziell vorhersagt, und führen eine auf Normalisierungsfluss basierende Pose-Prior sowie eine gemeinsame Gelenkwinkelverlustfunktion ein, um Bewegungsrealismus zu erreichen. Unsere Experimente auf zwei etablierten Benchmark-Datensätzen, Human3.6M und HumanEva-I, zeigen, dass unser Ansatz sowohl hinsichtlich der Stichproben-Vielfalt als auch der Genauigkeit die derzeit besten Baselines übertrifft. Der Quellcode ist unter https://github.com/wei-mao-2019/gsps verfügbar.