Command Palette
Search for a command to run...
PillarNet : Détection 3D d'objets basée sur les piliers en temps réel et à haute performance
PillarNet : Détection 3D d'objets basée sur les piliers en temps réel et à haute performance
Guangsheng Shi Ruifeng Li Chao Ma
Résumé
La détection 3D en temps réel et à haute performance est d'une importance cruciale pour les véhicules autonomes. Les détecteurs 3D les plus performants récents s'appuient principalement sur des convolutions basées sur des points ou sur des voxels 3D, qui s'avèrent toutes deux peu efficaces sur le plan computationnel pour un déploiement embarqué. À l'inverse, les méthodes basées sur des piliers n'utilisent que des convolutions 2D, ce qui réduit considérablement la consommation de ressources computationnelles, mais elles restent nettement inférieures à leurs homologues basés sur les voxels en termes de précision de détection. Dans cet article, en analysant l'écart principal de performance entre les détecteurs basés sur des piliers et ceux basés sur des voxels, nous proposons un détecteur basé sur des piliers, rapide et hautement performant, nommé PillarNet. Le modèle PillarNet se compose d'un réseau d'encodeur puissant pour une apprentissage efficace des caractéristiques des piliers, d'un réseau de « neck » pour la fusion de caractéristiques spatiales et sémantiques, ainsi que d'une tête de détection classique. En n'utilisant que des convolutions 2D, PillarNet est flexible quant à la taille des piliers et compatible avec les architectures classiques de CNN 2D, telles que VGGNet et ResNet. En outre, PillarNet bénéficie d'une fonction de perte de régression d'IoU découplée selon l'orientation, ainsi que d'une branche de prédiction consciente de l'IoU. Des résultats expérimentaux étendus sur les grands jeux de données nuScenes et Waymo Open Dataset démontrent que PillarNet atteint des performances supérieures aux méthodes de détection 3D les plus avancées en termes d'efficacité et de précision. Le code source est disponible à l'adresse suivante : \url{https://github.com/agent-sgs/PillarNet}.