HyperAIHyperAI
il y a 11 jours

HEDNet : Un réseau hiérarchique encodeur-décodeur pour la détection d'objets 3D dans des nuages de points

Gang Zhang, Junnan Chen, Guohuan Gao, Jianmin Li, Xiaolin Hu
HEDNet : Un réseau hiérarchique encodeur-décodeur pour la détection d'objets 3D dans des nuages de points
Résumé

La détection d'objets 3D dans les nuages de points est essentielle pour les systèmes de conduite autonome. Un défi majeur en détection 3D provient de la distribution sparse des points au sein de la scène 3D. Les méthodes actuelles à haute performance exploitent généralement des réseaux de neurones convolutifs 3D creux avec des noyaux de petite taille pour extraire des caractéristiques. Afin de réduire les coûts computationnels, ces méthodes recourent aux convolutions creuses de sous-variétés, qui empêchent tout échange d'information entre caractéristiques spatialement disjointes. Certaines approches récentes ont tenté de résoudre ce problème en introduisant des convolutions à grand noyau ou des mécanismes d'attention auto-attention, mais elles obtiennent soit des améliorations limitées en précision, soit des coûts computationnels excessifs. Nous proposons HEDNet, un réseau hiérarchique encodeur-décodeur pour la détection d'objets 3D, qui exploite des blocs encodeur-décodeur afin de capturer les dépendances à longue portée entre les caractéristiques dans l'espace spatial, en particulier pour les objets grands et éloignés. Nous avons mené des expériences approfondies sur les jeux de données Waymo Open et nuScenes. HEDNet atteint une précision de détection supérieure à celle des méthodes de l’état de l’art précédentes sur les deux jeux de données, tout en maintenant une efficacité compétitive. Le code est disponible à l’adresse suivante : https://github.com/zhanggang001/HEDNet.

HEDNet : Un réseau hiérarchique encodeur-décodeur pour la détection d'objets 3D dans des nuages de points | Articles de recherche récents | HyperAI