il y a 11 jours
Fusion multi-tâches multi-capteurs pour la détection d'objets 3D
Ming Liang, Bin Yang, Yun Chen, Rui Hu, Raquel Urtasun

Résumé
Dans cet article, nous proposons d'exploiter plusieurs tâches liées afin d'obtenir une détection précise d'objets 3D à partir de multiples capteurs. À cette fin, nous présentons une architecture apprenable end-to-end qui reasonne simultanément sur la détection d'objets en 2D et en 3D, ainsi que sur l'estimation du sol et la complétion de profondeur. Nos expériences montrent que ces différentes tâches sont complémentaires et aident le réseau à apprendre des représentations améliorées grâce à la fusion d'informations à différents niveaux. De manière importante, notre approche obtient les meilleurs résultats sur le benchmark KITTI pour la détection d'objets en 2D, en 3D et en vue de dessus (BEV), tout en étant en temps réel.