Réseaux de Points Fully-Convolutionnels pour les Nuages de Points à Grande Échelle

Ce travail propose une architecture de réseau neuronal entièrement convolutif à usage général pour le traitement efficace de données 3D à grande échelle. Une caractéristique remarquable de notre approche est sa capacité à traiter des représentations 3D non organisées, telles que les nuages de points, en entrée, puis à les transformer internement en structures ordonnées pour être traitées par des convolutions 3D. Contrairement aux approches conventionnelles qui maintiennent soit des représentations non organisées, soit des représentations organisées, de l'entrée à la sortie, notre méthode présente l'avantage d'opérer sur des représentations d'entrée de données efficaces en mémoire tout en exploitant la structure naturelle des opérations convolutives pour éviter le calcul et le stockage redondants d'informations spatiales dans le réseau. Le réseau élimine la nécessité de pré- ou post-traiter les données brutes issues des capteurs. Cela, combiné à la nature entièrement convolutive du réseau, en fait une méthode bout-à-bout capable de traiter des nuages de points d'espaces immenses ou même d'entiers locaux contenant jusqu'à 200 000 points en une seule fois. Un autre avantage est que notre réseau peut produire soit une sortie ordonnée, soit mapper directement les prédictions sur le nuage d'entrée, ce qui le rend adapté comme descripteur général de nuages de points applicable à de nombreuses tâches 3D. Nous démontrons la capacité de notre réseau à apprendre efficacement tant des caractéristiques de bas niveau que des relations compositionnelles complexes en l'évaluant sur des jeux de données de référence pour la segmentation sémantique voxelique, la segmentation sémantique par parties et la légendage de scènes 3D.