Best Practices für die Vorhersage von 2-Körper-Posen

Die Aufgabe der kooperativen Vorhersage menschlicher Pose besteht darin, die zukünftigen Posen mehrerer interagierender Personen anhand ihrer früheren Posen zu prognostizieren. Die Vorhersage von zwei interagierenden Personen anstelle jeder einzeln verspricht bessere Ergebnisse, aufgrund der Korrelationen zwischen ihren Körperbewegungen. Bislang ist diese Aufgabe jedoch weitgehend unerforscht geblieben.In dieser Arbeit überprüfen wir den Fortschritt in der Vorhersage menschlicher Pose und geben eine detaillierte Bewertung derjenigen Einzelpersonen-Methoden, die sich am besten für die Prognose von 2-Körper-Bewegungen eignen. Unsere Studie bestätigt den positiven Einfluss von Frequenzeingabedarstellungen, räumlich-zeitlich trennbaren und vollständig lernbaren Interaktionsadjazenzmatrizen sowohl für die codierende GCN (Graph Convolutional Network) als auch für die dekodierende FC (Fully Connected) Schicht. Andere Methoden zur Vorhersage von Einzelpersonen lassen sich nicht auf 2-Körper-Bewegungen übertragen, daher schließen wir hierarchische Körpermmodelle oder aufmerksamkeitsbasierte Interaktionscodierung aus den vorgeschlagenen besten Praktiken aus.Darüber hinaus leisten wir einen Beitrag durch ein neues Initialisierungsverfahren für die räumlichen Interaktionsparameter des Encoders im 2-Körper-Fall, das Leistung und Stabilität verbessert. Insgesamt erzielen unsere vorgeschlagenen besten Praktiken für die 2-Körper-Pose-Vorhersage eine Leistungssteigerung von 21,9 % im Vergleich zum aktuellen Stand der Technik auf dem neuesten ExPI-Datensatz, wobei das neue Initialisierungsverfahren einen Anteil von 3,5 % daran hat. Siehe unsere Projektseite unter https://www.pinlab.org/bestpractices2body