SCF-Net : Apprentissage de caractéristiques contextuelles spatiales pour la segmentation de nuages de points à grande échelle

L’apprentissage de caractéristiques efficaces à partir de nuages de points à grande échelle pour la segmentation sémantique a suscité un intérêt croissant ces dernières années. À cet effet, nous proposons un module apprenable qui extrait des caractéristiques contextuelles spatiales à partir de nuages de points à grande échelle, appelé SCF dans cet article. Ce module proposé se compose principalement de trois blocs : le bloc de représentation polaire locale, le bloc d’agrégation attentive à distance double, et le bloc de caractéristiques contextuelles globales. Pour chaque point 3D, le bloc de représentation polaire locale est d’abord exploité afin de construire une représentation spatiale invariante à la rotation autour de l’axe z. Ensuite, le bloc d’agrégation attentive à distance double est conçu pour exploiter les représentations de ses voisins afin d’apprendre des caractéristiques locales plus discriminantes, en tenant compte à la fois des distances géométriques et des distances de caractéristiques entre ces points. Enfin, le bloc de caractéristiques contextuelles globales est mis en place pour apprendre un contexte global pour chaque point 3D en exploitant sa position spatiale ainsi que le rapport de volume entre son voisinage et le nuage de points global. Le module proposé peut être facilement intégré dans diverses architectures de réseaux pour la segmentation de nuages de points, conduisant naturellement à une nouvelle architecture de segmentation sémantique 3D à architecture encodeur-décodeur, nommée SCF-Net dans ce travail. Des résultats expérimentaux étendus sur deux jeux de données publics démontrent que SCF-Net obtient de meilleurs résultats que plusieurs méthodes de pointe dans la plupart des cas.