Segmentation sémantique pour des scènes de nuages de points réels via une augmentation bilatérale et une fusion adaptative

Étant donné l'importance croissante des capteurs 3D actuels, une analyse fine des données brutes de nuages de points mérite une investigation approfondie. En particulier, les scènes réelles de nuages de points permettent de capturer de manière intuitive des environnements complexes du monde réel, mais en raison de la nature brute des données 3D, elles posent des défis considérables pour la perception par machine. Dans ce travail, nous nous concentrons sur la tâche visuelle fondamentale que constitue la segmentation sémantique, appliquée à de grands nuages de points recueillis dans des environnements réels. D'une part, afin de réduire l'ambiguïté entre points voisins, nous enrichissons leur contexte local en exploitant pleinement à la fois les caractéristiques géométriques et sémantiques dans une architecture bidirectionnelle. D'autre part, nous interprétons de manière globale la distinctivité des points à plusieurs échelles et représentons la carte de caractéristiques selon une méthode d'agrégation adaptative au niveau des points, afin d'assurer une segmentation sémantique précise. En outre, nous fournissons des études d'ablation spécifiques ainsi que des visualisations intuitives pour valider nos modules clés. En comparant notre réseau avec les architectures de pointe sur trois benchmarks différents, nous démontrons l'efficacité de notre approche.