Réexamen de la classification de formes en nuages de points avec une base simple et efficace

Le traitement des nuages de points constitue une composante essentielle de nombreux systèmes du monde réel. À ce titre, une grande variété d’approches basées sur les points a été proposée, entraînant des améliorations continues sur les benchmarks au fil du temps. Nous analysons les éléments clés de cette évolution et mettons en évidence deux résultats fondamentaux. Premièrement, nous constatons que des facteurs auxiliaires tels que les schémas d’évaluation, les stratégies d’augmentation de données et les fonctions de perte — qui sont indépendants de l’architecture du modèle — ont un impact considérable sur les performances. Ces différences sont suffisamment importantes pour masquer l’effet de l’architecture elle-même. Lorsqu’on contrôle ces facteurs, PointNet++, un réseau relativement ancien, se révèle compétitif par rapport aux méthodes les plus récentes. Deuxièmement, une méthode très simple basée sur la projection, que nous appelons SimpleView, se montre étonnamment performante. Elle atteint des résultats équivalents ou supérieurs à ceux des méthodes d’état de l’art les plus sophistiquées sur ModelNet40, tout en étant deux fois plus petite que PointNet++. Elle surpasse également les méthodes d’état de l’art sur ScanObjectNN, un benchmark de nuages de points réel, et démontre une meilleure généralisation entre jeux de données. Le code est disponible à l’adresse suivante : https://github.com/princeton-vl/SimpleView.