Command Palette
Search for a command to run...
Réseau de neurones convolutifs sur graphes dynamiques pour l'apprentissage sur les nuages de points
Réseau de neurones convolutifs sur graphes dynamiques pour l'apprentissage sur les nuages de points
Résumé
Les nuages de points offrent une représentation géométrique souple, adaptée à un nombre infini d'applications en informatique graphique ; ils constituent également la sortie brute de la plupart des dispositifs d'acquisition de données 3D. Bien que des caractéristiques conçues manuellement sur les nuages de points aient été proposées depuis longtemps dans le domaine du graphisme et de la vision par ordinateur, le succès récent et spectaculaire des réseaux de neurones convolutifs (CNN) pour l'analyse d'images suggère la pertinence d'adapter les principes des CNN au domaine des nuages de points. Les nuages de points ne possèdent intrinsèquement aucune information topologique ; concevoir un modèle capable de restaurer cette topologie permettrait ainsi d'enrichir leur pouvoir de représentation. À cet effet, nous proposons un nouveau module de réseau de neurones appelé EdgeConv, adapté aux tâches de haut niveau basées sur les CNN sur les nuages de points, telles que la classification et la segmentation. EdgeConv opère sur des graphes calculés dynamiquement à chaque couche du réseau. Il est différentiable et peut être intégré dans des architectures existantes. Contrairement aux modules existants agissant dans l'espace extrinsèque ou traitant chaque point de manière indépendante, EdgeConv présente plusieurs propriétés attractives : il intègre les informations locales provenant des voisins proches ; il peut être empilé pour apprendre des propriétés globales de forme ; et dans les systèmes à plusieurs couches, l'affinité dans l'espace des caractéristiques permet de capturer des caractéristiques sémantiques sur des distances potentiellement longues dans l'embedding original. Nous démontrons les performances de notre modèle sur des benchmarks standards, notamment ModelNet40, ShapeNetPart et S3DIS.