Pseudo-LiDAR++ : Précision de la profondeur pour la détection d'objets 3D dans la conduite autonome

La détection d'objets tels que des voitures et des piétons en 3D joue un rôle indispensable dans la conduite autonome. Les approches existantes reposent largement sur des capteurs LiDAR coûteux pour obtenir des informations précises sur la profondeur. Bien que le pseudo-LiDAR ait récemment été introduit comme une alternative prometteuse, offrant des informations sur la profondeur à un coût beaucoup plus faible grâce uniquement à des images stéréoscopiques, il existe encore un écart notable en termes de performance. Dans cet article, nous apportons des avancées considérables au cadre du pseudo-LiDAR grâce à des améliorations dans l'estimation de la profondeur stéréoscopique. Plus précisément, nous adaptons l'architecture du réseau stéréoscopique et la fonction de perte pour qu'elles soient plus alignées avec l'estimation précise de la profondeur des objets lointains --- actuellement la principale faiblesse du pseudo-LiDAR. De plus, nous explorons l'idée d'utiliser des capteurs LiDAR moins chers mais extrêmement épars, qui seuls fournissent une information insuffisante pour la détection 3D, afin de corriger nos estimations de profondeur. Nous proposons un algorithme de propagation de profondeur, guidé par les estimations initiales de profondeur, pour diffuser ces quelques mesures exactes sur toute la carte de profondeur. Nous montrons sur le benchmark KITTI pour la détection d'objets que notre approche combinée apporte des améliorations substantielles dans l'estimation de la profondeur et la détection d'objets 3D basée sur le stéréo --- surpassant l'exactitude précédente de détection d'objets lointains d'un état de l'art par 40 %. Notre code est disponible à l'adresse https://github.com/mileyan/Pseudo_Lidar_V2.