Réseaux de convolution 3D cylindriques et asymétriques pour la segmentation LiDAR

Les méthodes de pointe pour la segmentation de grandes scènes de conduite à l'aide du LiDAR projettent souvent les nuages de points dans un espace 2D et les traitent ensuite par convolution 2D. Bien que cette approche montre sa compétitivité dans le traitement des nuages de points, elle modifie inévitablement et abandonne la topologie 3D et les relations géométriques. Une solution naturelle est d'utiliser la voxelisation 3D et les réseaux de convolution 3D. Cependant, nous avons constaté que dans le nuage de points en extérieur, l'amélioration obtenue par cette méthode est assez limitée. Une raison importante est la nature du nuage de points en extérieur, caractérisée par sa rareté et sa densité variable. Inspirés par ces observations, nous proposons un nouveau cadre pour la segmentation du LiDAR en extérieur, où une partition cylindrique et des réseaux de convolution 3D asymétriques sont conçus pour explorer les motifs géométriques 3D tout en préservant ces propriétés inhérentes. De plus, un module de raffinement ponctuel est introduit pour atténuer les interférences dues à l'encodage des labels basé sur des voxels imparfaits. Nous évaluons le modèle proposé sur deux grands ensembles de données, à savoir SemanticKITTI et nuScenes. Notre méthode occupe la première place du classement SemanticKITTI et surpasse les méthodes existantes sur nuScenes avec une marge notable d'environ 4 %. En outre, le cadre 3D proposé généralise également bien à la segmentation panoramique du LiDAR et à la détection 3D du LiDAR.