Détection précise d'objets 3D utilisant des modèles basés sur l'énergie

La détection 3D d’objets (3DOD) précise est essentielle pour assurer la navigation sécurisée des robots autonomes dans des environnements complexes. Toutefois, la régression de boîtes englobantes 3D précises à partir de données LiDAR éparses dans des environnements encombrés constitue un problème extrêmement difficile. Nous abordons cette tâche en explorant les avancées récentes des modèles énergétiques conditionnels (EBM) pour la régression probabiliste. Bien que les méthodes utilisant les EBM pour la régression aient démontré des performances remarquables dans la détection d’objets 2D sur images, ces approches ne sont pas directement applicables aux boîtes englobantes 3D. Dans ce travail, nous proposons donc un opérateur de pooling différentiable conçu spécifiquement pour les boîtes englobantes 3D, servant de module central dans notre réseau EBM. Nous intégrons par ailleurs cette approche générale dans le détecteur d’objets 3D de pointe SA-SSD. Sur le jeu de données KITTI, notre méthode proposée surpasse de manière cohérente le modèle de référence SA-SSD sur l’ensemble des métriques de 3DOD, démontrant ainsi le potentiel de la régression basée sur les EBM pour une détection 3D très précise. Le code est disponible à l’adresse suivante : https://github.com/fregu856/ebms_3dod.