3D-FCT : Détection et suivi simultanés d'objets 3D à l'aide de la corrélation de caractéristiques

La détection d'objets 3D à partir de données LiDAR reste une tâche essentielle pour des applications telles que la conduite autonome et la robotique. Contrairement aux images 2D, les données LiDAR sont presque toujours acquises sur une période de temps. Toutefois, la majorité des travaux dans ce domaine se concentrent sur la détection indépendamment du domaine temporel. Dans cet article, nous proposons 3D-FCT, une architecture de réseau Siamese qui exploite les informations temporelles pour effectuer simultanément les tâches corrélées de détection d'objets 3D et de suivi. Le réseau est entraîné à prédire le mouvement d’un objet à partir des caractéristiques de corrélation des points clés extraits au fil du temps. Le calcul de la corrélation entre les points clés permet uniquement une détection en temps réel. Nous étendons par la suite l’objectif multi-tâches en intégrant une perte de régression pour le suivi. Enfin, nous obtenons des détections à haute précision en reliant les trajectoires courtes (tracklets) d’objets en trajectoires longues basées sur les trajectoires prédites. La méthode proposée est évaluée sur le jeu de données de suivi KITTI, où elle montre une amélioration de 5,57 % en mAP par rapport à une approche de pointe.