Social LSTM : Prédiction de trajectoire humaine dans les espaces bondés

Les êtres humains se déplacent dans des environnements complexes et bondés en se basant sur des conventions sociales : ils respectent l’espace personnel, cèdent le passage et évitent les collisions. Dans notre travail, nous proposons une approche fondée sur les données pour apprendre les interactions humain-humain afin de prédire leurs trajectoires futures. Cette approche s’oppose aux méthodes traditionnelles qui reposent sur des fonctions conçues manuellement, telles que les forces sociales. Nous présentons un nouveau modèle à mémoire à court et long terme (LSTM) capable de raisonner conjointement sur plusieurs individus au sein d’une scène. Contrairement à l’LSTM classique, nous partageons l’information entre plusieurs LSTMs grâce à une nouvelle couche de pooling. Cette couche agrège les représentations cachées des LSTMs associées aux trajectoires voisines afin de capturer les interactions au sein de ce voisinage. Nous démontrons la performance de notre méthode sur plusieurs jeux de données publics. Notre modèle dépasse les méthodes précédentes de prédiction de plus de 42 %. Nous analysons également les trajectoires prédites par notre modèle afin de mettre en évidence des comportements sociaux tels que l’évitement des collisions et les mouvements de groupe, qui ont été appris automatiquement par notre modèle.