Apprentissage progressif de tâches de prétexte pour la prédiction de trajectoires humaines

La prédiction de trajectoire humaine est une tâche pratique consistant à anticiper les positions futures des piétons sur la route, couvrant typiquement toutes les échelles temporelles, du court terme au long terme, au sein d’une trajectoire. Toutefois, les travaux existants tentent de traiter la prédiction complète de la trajectoire à l’aide d’un seul et même paradigme d’entraînement, négligeant ainsi la distinction fondamentale entre les dynamiques à court terme et à long terme dans les trajectoires humaines. Pour surmonter cette limitation, nous proposons un nouveau cadre d’apprentissage progressif par tâches prétextes (Progressive Pretext Task learning, PPT), qui améliore progressivement la capacité du modèle à capturer les dynamiques à court terme ainsi que les dépendances à long terme, afin d’obtenir une prédiction finale de trajectoire complète. Plus précisément, nous avons soigneusement conçu trois étapes d’apprentissage au sein du cadre PPT. Dans la première étape, le modèle apprend à comprendre les dynamiques à court terme grâce à une tâche de prédiction progressive de la position suivante. Dans la deuxième étape, le modèle est renforcé pour mieux saisir les dépendances à long terme via une tâche de prédiction de destination. Enfin, dans la dernière étape, le modèle vise à résoudre la tâche complète de prédiction de trajectoire future en tirant pleinement parti des connaissances acquises aux étapes précédentes. Pour atténuer le phénomène d’oubli des connaissances, nous appliquons par ailleurs une distillation de connaissance croisée entre tâches. Par ailleurs, nous avons conçu un prédicteur de trajectoire basé sur le Transformer, capable d’effectuer une raisonning en deux étapes hautement efficace grâce à une stratégie de prédiction pilotée par la destination et à un ensemble d’embeddings prompts apprenables. Des expériences étendues sur des benchmarks populaires ont démontré que notre approche atteint des performances de pointe tout en assurant une grande efficacité. Le code est disponible à l’adresse suivante : https://github.com/iSEE-Laboratory/PPT.