HyperAIHyperAI
il y a 17 jours

MuGNet : Réseau de neurones graphiques à multi-résolution pour la segmentation de nuages de points à grande échelle

{Kenji Shimada, Tomotake Furuhata, Liuyue Xie}
Résumé

Dans cet article, nous proposons une architecture d’apprentissage profond multi-résolution pour la segmentation sémantique de nuages de points denses à grande échelle. Les données de nuages de points denses nécessitent un processus d’encodage de caractéristiques coûteux en termes de calcul avant la segmentation sémantique. Les travaux antérieurs ont adopté différentes approches afin de réduire drastiquement la résolution du nuage de points original, afin de permettre l’utilisation d’équipements informatiques standards. Bien que ces méthodes puissent atténuer partiellement la charge computationnelle, elles restent limitées en capacité de traitement lorsqu’il s’agit de plusieurs scans. Nous présentons MuGNet, un cadre de réseau de neurones graphiques efficace en mémoire et end-to-end, conçu pour effectuer la segmentation sémantique sur des nuages de points à grande échelle. Nous réduisons la demande computationnelle en exploitant un réseau de neurones graphiques sur des graphes de points préformés, tout en préservant la précision de la segmentation grâce à un réseau bidirectionnel qui fusionne les embeddings de caractéristiques à différentes résolutions. Notre architecture a été validée sur des jeux de données de référence, notamment le Stanford Large-Scale 3D Indoor Spaces Dataset (S3DIS) et le Virtual KITTI Dataset. Nous démontrons que notre cadre peut traiter jusqu’à 45 scans de pièces simultanément sur une seule GPU de 11 Go, tout en dépassant les autres solutions basées sur les graphes pour la segmentation sur S3DIS, avec une précision globale de 88,5 % (+3 %) et une mIOU de 69,8 % (+7,7 %).