Détection d'objets 3D stéréoscopique guidée par la confiance avec estimation de profondeur séparée

Une détection d'objets 3D précise et fiable est essentielle pour une conduite autonome sûre. Malgré les récentes avancées, l'écart de performance entre les méthodes basées sur la stéréoscopie et celles basées sur le LiDAR reste considérable. Une estimation de profondeur précise est cruciale pour la performance des méthodes de détection d'objets 3D basées sur la stéréoscopie, en particulier pour les pixels associés aux objets au premier plan. De plus, ces méthodes souffrent d'une forte variance dans l'exactitude de l'estimation de profondeur, qui n'est souvent pas prise en compte dans le pipeline de détection d'objets. Pour résoudre ces deux problèmes, nous proposons CG-Stereo, un pipeline de détection d'objets 3D guidé par la confiance qui utilise des décodeurs distincts pour les pixels du premier plan et ceux du fond lors de l'estimation de profondeur, et exploite l'estimation de confiance du réseau d'estimation de profondeur comme mécanisme d'attention douce dans le détecteur d'objets 3D. Notre approche surpassent tous les détecteurs 3D stéréoscopiques de pointe sur le benchmark KITTI.