HyperAIHyperAI

Command Palette

Search for a command to run...

Frustum-PointPillars : une approche multi-stades pour la détection d'objets 3D utilisant une caméra RGB et un LiDAR

Christian Laugier Özgür Erkent David Sierra-Gonzalez Anshul Paigwar

Résumé

La détection 3D précise d’objets constitue une composante essentielle du module de perception des véhicules autonomes. Une meilleure compréhension des objets dans l’espace 3D permet d’améliorer la prise de décision et la planification de trajectoire. Les caméras RGB et les capteurs LiDAR sont les capteurs les plus couramment utilisés dans les véhicules autonomes pour la perception de l’environnement. Bien que de nombreuses approches aient obtenu des résultats prometteurs pour la détection 2D à partir d’images RGB, la localisation efficace d’objets de petite taille, tels que les piétons, dans les nuages de points 3D de scènes complexes reste un défi important en recherche. Nous proposons une nouvelle méthode, Frustum-PointPillars, pour la détection 3D d’objets à partir de données LiDAR. Contrairement aux approches se fondant uniquement sur les caractéristiques du nuage de points, nous exploitons le domaine bien établi de la détection 2D pour réduire l’espace de recherche dans l’espace 3D. Ensuite, nous utilisons le réseau de codage des caractéristiques par « Pillars » pour la localisation des objets dans le nuage de points réduit. Nous introduisons également une nouvelle approche de masquage des nuages de points afin d’améliorer davantage la précision de localisation. Notre réseau est entraîné sur le jeu de données KITTI et des expériences sont menées pour démontrer son efficacité. Sur l’ensemble de test KITTI, notre méthode surpasser les approches les plus avancées (SOTA) multi-capteurs existantes pour la localisation 3D des piétons (vue en plan, Bird’s Eye View), tout en atteignant un débit de traitement significativement plus élevé, de l’ordre de 14 Hz.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Frustum-PointPillars : une approche multi-stades pour la détection d'objets 3D utilisant une caméra RGB et un LiDAR | Articles | HyperAI