Prévisions de trajectoire dans des environnements inconnus conditionnées par des plans basés sur une grille

Nous abordons le problème de la prédiction des trajectoires de piétons et de véhicules dans des environnements inconnus, conditionnée par leur mouvement passé et la structure de la scène. La prédiction de trajectoires constitue un défi majeur en raison de la grande variabilité des structures de scène et de la distribution multimodale des trajectoires futures. Contrairement aux approches antérieures qui apprennent directement une application un-à-plusieurs à partir du contexte observé vers plusieurs trajectoires futures, nous proposons de conditionner la prédiction des trajectoires sur des plans échantillonnés à partir d’une politique basée sur une grille, apprise par apprentissage par renforcement inverse à entropie maximale (MaxEnt IRL). Nous reformulons l’approche MaxEnt IRL afin de permettre à la politique d’inférer simultanément des objectifs plausibles pour les agents et les chemins menant à ces objectifs sur une grille 2-D grossière définie sur la scène. Nous proposons un générateur de trajectoires basé sur l’attention, capable de produire des trajectoires futures à valeurs continues, conditionnées par des séquences d’états échantillonnées à partir de la politique MaxEnt. Des évaluations quantitatives et qualitatives effectuées sur les jeux de données publics Stanford Drone et NuScenes montrent que notre modèle génère des trajectoires diversifiées, reflétant la distribution prédictive multimodale, tout en restant précises et conformes à la structure sous-jacente de la scène sur de longues horizons de prédiction.