HyperAIHyperAI
il y a 2 mois

PointNeXt : Revisiter PointNet++ avec des Stratégies d'Entraînement et de Mise à l'Échelle Améliorées

Qian, Guocheng ; Li, Yuchen ; Peng, Houwen ; Mai, Jinjie ; Hammoud, Hasan Abed Al Kader ; Elhoseiny, Mohamed ; Ghanem, Bernard
PointNeXt : Revisiter PointNet++ avec des Stratégies d'Entraînement et de Mise à l'Échelle Améliorées
Résumé

PointNet++ est l'une des architectures neurales les plus influentes pour la compréhension des nuages de points. Bien que la précision de PointNet++ ait été largement dépassée par des réseaux récents tels que PointMLP et Point Transformer, nous constatons qu'une grande partie du gain de performance est attribuable à des stratégies d'entraînement améliorées, c'est-à-dire des techniques d'augmentation de données et d'optimisation, ainsi qu'à une augmentation de la taille des modèles plutôt qu'à des innovations architecturales. Par conséquent, le potentiel complet de PointNet++ n'a pas encore été pleinement exploité. Dans cette étude, nous revisitons l'architecture classique PointNet++ grâce à une analyse systématique des stratégies d'entraînement et de mise à l'échelle du modèle, et apportons deux contributions majeures. Premièrement, nous proposons un ensemble de stratégies d'entraînement améliorées qui améliorent considérablement les performances de PointNet++. Par exemple, nous montrons que sans aucune modification architecturale, la précision globale (OA) de PointNet++ sur la classification d'objets ScanObjectNN peut être augmentée de 77,9% à 86,1%, surpassant même le dernier PointMLP. Deuxièmement, nous intégrons un design de bouteille d'inversion résiduelle et des MLP séparables dans PointNet++ afin de permettre une mise à l'échelle efficace et performante du modèle, et proposons PointNeXt, la version suivante des PointNets. PointNeXt peut être facilement mis à l'échelle et surpasse les méthodes les plus avancées actuellement disponibles dans les tâches de classification 3D et de segmentation sémantique. Pour la classification, PointNeXt atteint une précision globale de 87,7% sur ScanObjectNN, surpassant PointMLP de 2,3%, tout en étant 10 fois plus rapide lors de l'inférence. Pour la segmentation sémantique, PointNeXt établit un nouveau record avec un IoU moyen de 74,9% sur S3DIS (validation croisée 6 fois), surpassant le récent Point Transformer. Le code source et les modèles sont disponibles à l'adresse suivante : https://github.com/guochengqian/pointnext.

PointNeXt : Revisiter PointNet++ avec des Stratégies d'Entraînement et de Mise à l'Échelle Améliorées | Articles de recherche récents | HyperAI