LCPFormer : Vers une analyse efficace des nuages de points 3D par propagation du contexte local dans les transformers

Le Transformer, avec son mécanisme d'attention sous-jacent et sa capacité à capturer des dépendances à longue portée, est devenu un choix naturel pour les données de nuages de points non ordonnés. Cependant, la séparation des régions locales dans l'architecture d'échantillonnage générale perturbe les informations structurelles des instances, et les relations inhérentes entre les régions locales adjacentes manquent d'exploration, alors que les informations structurelles locales sont cruciales dans un modèle de nuages de points 3D basé sur le Transformer. Par conséquent, dans cet article, nous proposons un nouveau module nommé Propagation du Contexte Local (LCP) pour exploiter le passage de messages entre les régions locales voisines et rendre leurs représentations plus informatives et discriminantes.Plus précisément, nous utilisons les points d'overlap des régions locales adjacentes (qui statistiquement se révèlent être prédominants) comme intermédiaires, puis nous réattribuons le poids des caractéristiques de ces points partagés provenant de différentes régions locales avant de les transmettre aux couches suivantes. L'insertion du module LCP entre deux couches Transformer entraîne une amélioration significative de l'expressivité du réseau. Enfin, nous concevons une architecture LCPFormer flexible équipée du module LCP. La méthode proposée est applicable à différentes tâches et surpasse diverses méthodes basées sur le Transformer dans des benchmarks incluant la classification de formes 3D et des tâches de prédiction dense telles que la détection d'objets 3D et la segmentation sémantique.Le code sera rendu disponible pour permettre la reproduction des résultats.