Command Palette
Search for a command to run...
RoarNet : Une Détection Robuste d'Objets 3D basée sur le Raffinement d'Approximation de Région
RoarNet : Une Détection Robuste d'Objets 3D basée sur le Raffinement d'Approximation de Région
Kiwoo Shin; Youngwook Paul Kwon; Masayoshi Tomizuka
Résumé
Nous présentons RoarNet, une nouvelle approche pour la détection d'objets 3D à partir d'une image 2D et de nuages de points 3D Lidar. Basée sur un cadre de détection d'objets en deux étapes avec PointNet comme réseau principal, nous proposons plusieurs idées innovantes pour améliorer les performances de la détection d'objets 3D. La première partie de notre méthode, RoarNet_2D, estime les poses 3D des objets à partir d'une image monoculaire, ce qui permet d'identifier où effectuer des examens plus approfondis, et génère plusieurs candidats géométriquement plausibles. Cette étape réduit considérablement le nombre de régions 3D potentielles, ce qui serait autrement nécessaire pour traiter les nuages de points 3D dans un espace de recherche vaste et complexe. Ensuite, la deuxième partie, RoarNet_3D, prend en charge ces régions candidates et effectue des inférences approfondies pour conclure les poses finales de manière récursive. Inspiré par PointNet, RoarNet_3D traite directement les nuages de points 3D sans aucune perte de données, conduisant ainsi à une détection précise. Nous évaluons notre méthode sur KITTI, un benchmark pour la détection d'objets 3D. Nos résultats montrent que RoarNet offre des performances supérieures aux méthodes les plus avancées actuellement disponibles publiquement. Notamment, RoarNet surpass même les méthodes les plus avancées dans des configurations où le Lidar et la caméra ne sont pas synchronisés temporellement, ce qui est particulièrement important pour les environnements de conduite réels. RoarNet est implémenté dans Tensorflow et mis à disposition du public avec des modèles pré-entraînés.