Un regard plus attentif sur les opérateurs d'agrégation locale dans l'analyse de nuages de points

Les avancées récentes dans les architectures de réseau pour le traitement des nuages de points sont principalement impulsées par de nouvelles conceptions d'opérateurs d'agrégation locale. Toutefois, l'impact de ces opérateurs sur la performance du réseau n’a pas été soigneusement étudié, en raison des différences d’architecture globale et des détails d’implémentation propres à chaque solution. Par ailleurs, la plupart de ces opérateurs ne sont appliqués que dans des architectures peu profondes. Dans ce travail, nous revisitons des opérateurs d’agrégation locale représentatifs et évaluons leur performance en utilisant la même architecture résiduelle profonde. Notre étude révèle que, malgré leurs conceptions différentes, tous ces opérateurs apportent des contributions étonnamment similaires à la performance du réseau, sous des conditions identiques en nombre d’entrée et de caractéristiques, et permettent d’atteindre une précision de pointe sur les benchmarks standards. Ce résultat nous incite à repenser la nécessité d’une conception sophistiquée des opérateurs d’agrégation locale pour le traitement des nuages de points. À cet effet, nous proposons un opérateur d’agrégation locale simple, sans poids apprenables, nommé Position Pooling (PosPool), qui se comporte aussi bien ou légèrement mieux que les opérateurs existants complexes. En particulier, un réseau résiduel profond simple comprenant des couches PosPool obtient des performances remarquables sur tous les benchmarks, surpassant largement les méthodes précédentes sur le délicat jeu de données PartNet (7,4 mIoU). Le code est disponible publiquement à l’adresse suivante : https://github.com/zeliu98/CloserLook3D