LaneRCNN : Représentations distribuées pour la prévision du mouvement centrée sur les graphes

Prédire les comportements futurs des acteurs dynamiques est une tâche essentielle dans de nombreuses applications robotiques, telles que les véhicules autonomes. Ce défi est particulièrement difficile, car les acteurs possèdent des intentions latentes et leurs trajectoires sont régies par des interactions complexes entre les autres acteurs, eux-mêmes et la carte. Dans cet article, nous proposons LaneRCNN, un modèle de prédiction de mouvement centré sur les graphes. De manière cruciale, en s’appuyant sur un encodeur de graphe spécialement conçu, nous apprenons une représentation locale du graphe de voies par acteur (LaneRoI) afin de coder leurs mouvements passés ainsi que la topologie locale de la carte. Nous avons également développé un module d’interaction permettant un échange efficace d’informations entre les représentations locales de graphe au sein d’un graphe global partagé de voies. En outre, nous paramétrons les trajectoires prédites à partir des graphes de voies, une approche de paramétrisation plus adaptée. Notre modèle LaneRCNN capture de manière distribuée et cartographiquement consciente les relations entre acteurs ainsi que les relations entre acteurs et carte. Nous démontrons l’efficacité de notre approche sur le grand benchmark Argoverse de prédiction de mouvement. Nous obtenons la première place au classement et surpassons significativement les résultats précédemment les meilleurs.