Suivi combiné dans l'espace image et l'espace monde dans les scènes de circulation

Le suivi dans les scènes de rues urbaines joue un rôle central dans les systèmes autonomes tels que les voitures autonomes. La plupart des méthodes actuelles de suivi basées sur la vision effectuent le suivi dans le domaine des images. D'autres approches, par exemple celles basées sur le LIDAR et le radar, suivent uniquement en 3D. Bien que certaines méthodes de suivi basées sur la vision intègrent des informations 3D dans certaines parties de leur pipeline, et que certaines méthodes basées sur la 3D utilisent des informations basées sur les images dans certains composants de leur approche, nous proposons d'utiliser conjointement des informations d'espace image et d'espace monde tout au long de notre méthode. Nous présentons notre pipeline de suivi comme une extension 3D du suivi basé sur les images. Du renforcement des détections avec des mesures 3D aux positions signalées de chaque objet suivi, nous utilisons des informations 3D d'espace monde à chaque étape du traitement. Nous réalisons cela grâce à notre filtre de Kalman couplé 2D-3D novateur, combiné à un cadre hypothétique et sélectif conceptuellement propre et extensible. Notre approche correspond à l'état de l'art actuel selon le benchmark officiel KITTI, qui évalue uniquement dans le domaine des images 2D. Des expériences supplémentaires montrent des améliorations significatives en termes de précision de localisation 3D en activant notre suivi couplé 2D-3D.