HyperAIHyperAI
il y a 11 jours

Frustum-PointPillars : une approche multi-stades pour la détection d'objets 3D utilisant une caméra RGB et un LiDAR

{Christian Laugier, Özgür Erkent, David Sierra-Gonzalez, Anshul Paigwar}
Frustum-PointPillars : une approche multi-stades pour la détection d'objets 3D utilisant une caméra RGB et un LiDAR
Résumé

La détection 3D précise d’objets constitue une composante essentielle du module de perception des véhicules autonomes. Une meilleure compréhension des objets dans l’espace 3D permet d’améliorer la prise de décision et la planification de trajectoire. Les caméras RGB et les capteurs LiDAR sont les capteurs les plus couramment utilisés dans les véhicules autonomes pour la perception de l’environnement. Bien que de nombreuses approches aient obtenu des résultats prometteurs pour la détection 2D à partir d’images RGB, la localisation efficace d’objets de petite taille, tels que les piétons, dans les nuages de points 3D de scènes complexes reste un défi important en recherche. Nous proposons une nouvelle méthode, Frustum-PointPillars, pour la détection 3D d’objets à partir de données LiDAR. Contrairement aux approches se fondant uniquement sur les caractéristiques du nuage de points, nous exploitons le domaine bien établi de la détection 2D pour réduire l’espace de recherche dans l’espace 3D. Ensuite, nous utilisons le réseau de codage des caractéristiques par « Pillars » pour la localisation des objets dans le nuage de points réduit. Nous introduisons également une nouvelle approche de masquage des nuages de points afin d’améliorer davantage la précision de localisation. Notre réseau est entraîné sur le jeu de données KITTI et des expériences sont menées pour démontrer son efficacité. Sur l’ensemble de test KITTI, notre méthode surpasser les approches les plus avancées (SOTA) multi-capteurs existantes pour la localisation 3D des piétons (vue en plan, Bird’s Eye View), tout en atteignant un débit de traitement significativement plus élevé, de l’ordre de 14 Hz.

Frustum-PointPillars : une approche multi-stades pour la détection d'objets 3D utilisant une caméra RGB et un LiDAR | Articles de recherche récents | HyperAI