PolyNet : Réseau neuronal polynomial pour la reconnaissance de formes 3D avec la représentation PolyShape

La représentation de forme 3D et son traitement ont des effets considérables sur la reconnaissance de formes 3D. La maillage polygonal, en tant que représentation de forme 3D, présente de nombreux avantages dans les domaines de la synthèse d'images et du traitement géométrique. Cependant, les méthodes actuelles basées sur les réseaux neuronaux profonds (DNN) font toujours face à certains défis liés à la représentation par maillage polygonal, tels que la gestion des variations dans le degré et les permutations des sommets ainsi que leurs distances mutuelles. Pour surmonter ces défis, nous proposons une méthode basée sur un réseau neuronal profond (PolyNet) et une représentation spécifique de maillage polygonal (PolyShape) dotée d'une structure multi-résolution.PolyNet comprend deux opérations : (1) une opération de convolution polynomiale (PolyConv) avec des coefficients apprenables, qui apprend des distributions continues en tant que filtres de convolution pour partager les poids entre différents sommets, et (2) une procédure de regroupement polygonal (PolyPool) utilisant la structure multi-résolution de PolyShape pour agréger les caractéristiques dans une dimension beaucoup plus faible. Nos expériences démontrent la force et les avantages de PolyNet dans les tâches de classification et de recherche de formes 3D par rapport aux méthodes existantes basées sur le maillage polygonal, ainsi que sa supériorité dans la classification des représentations graphiques d'images. Le code est librement disponible à l'adresse suivante : https://myavartanoo.github.io/polynet/.