Propositions d'objets 3D pour une détection précise de classes d'objets

L’objectif de cet article est de générer des propositions d’objets 3D de haute qualité dans le cadre de la conduite autonome. Notre méthode exploite les images stéréo afin de positionner ces propositions sous la forme de boîtes englobantes 3D. Nous formulons ce problème comme une minimisation d’une fonction d’énergie qui encode des priorités sur la taille des objets, le plan de terre, ainsi que plusieurs caractéristiques informées par la profondeur, permettant de raisonner sur l’espace libre, la densité des nuages de points et la distance au sol. Nos expériences montrent des gains significatifs par rapport aux méthodes existantes basées sur les images RGB et RGB-D sur le défi KITTI. Associée à un score basé sur un réseau de neurones convolutif (CNN), notre approche dépasse tous les résultats existants pour les trois catégories d’objets du benchmark KITTI.