HyperAIHyperAI
il y a 2 mois

Social-BiGAT : Prédiction de trajectoires multimodales à l'aide de Bicycle-GAN et des réseaux de neurones à attention graphique

Vineet Kosaraju; Amir Sadeghian; Roberto Martín-Martín; Ian Reid; S. Hamid Rezatofighi; Silvio Savarese
Social-BiGAT : Prédiction de trajectoires multimodales à l'aide de Bicycle-GAN et des réseaux de neurones à attention graphique
Résumé

Prédire les trajectoires futures de plusieurs agents interactifs dans une scène est devenue un problème de plus en plus important pour de nombreuses applications, allant du contrôle des véhicules autonomes et des robots sociaux à la sécurité et à la surveillance. Ce problème est exacerbé par la présence d'interactions sociales entre les humains et leurs interactions physiques avec la scène. Bien que la littérature existante ait exploré certains de ces indices, elle a principalement ignoré la nature multimodale de chaque trajectoire future humaine. Dans cet article, nous présentons Social-BiGAT, un réseau génératif adversarial basé sur un graphe qui génère des prédictions de trajectoires réalistes et multimodales en modélisant mieux les interactions sociales des piétons dans une scène. Notre méthode repose sur un réseau d'attention basé sur un graphe (GAT) qui apprend des représentations de caractéristiques fiables encodant les interactions sociales entre les humains dans la scène, et sur une architecture d'encodeur-décodeur récurrente entraînée de manière antagoniste pour prédire, à partir des caractéristiques, les parcours des humains. Nous prenons explicitement en compte la nature multimodale du problème de prédiction en formant une transformation réversible entre chaque scène et son vecteur bruit latent, comme dans le Bicycle-GAN. Nous montrons que notre cadre atteint des performances de pointe en le comparant à plusieurs méthodes de référence sur des benchmarks existants de prévision de trajectoires.