ShellNet : Réseaux de neurones convolutifs efficaces pour les nuages de points utilisant des statistiques de coquilles concentriques

L'apprentissage profond avec des données 3D a connu une progression significative depuis l'introduction de réseaux neuronaux convolutifs capables de gérer l'ambiguïté de l'ordre des points dans les données de nuages de points. Bien que ces méthodes aient pu atteindre de bonnes performances dans diverses tâches de compréhension de scènes, elles souffraient souvent d'une vitesse d'entraînement faible et d'une architecture de réseau complexe. Dans cet article, nous abordons ces problèmes en proposant une convolution permutation-invariante efficace et intégrée pour l'apprentissage profond sur les nuages de points. Notre opérateur de convolution simple mais efficace, nommé ShellConv, utilise des statistiques issues d'enveloppes sphériques concentriques pour définir des caractéristiques représentatives et résoudre l'ambiguïté de l'ordre des points, permettant ainsi à la convolution traditionnelle d'être appliquée à ces caractéristiques. À partir de ShellConv, nous avons également construit un réseau neuronal efficace nommé ShellNet, capable de traiter directement les nuages de points avec des champs récepteurs plus larges tout en maintenant moins de couches. Nous démontrons l'efficacité de ShellNet en produisant des résultats à l'état de l'art pour la classification d'objets, la segmentation des parties d'objets et la segmentation sémantique des scènes, tout en conservant une vitesse d'entraînement très rapide du réseau.