HyperAIHyperAI
il y a 2 mois

R2-MLP : Round-Roll MLP pour la reconnaissance d'objets 3D multi-vues

Chen, Shuo ; Yu, Tan ; Li, Ping
R2-MLP : Round-Roll MLP pour la reconnaissance d'objets 3D multi-vues
Résumé

Récemment, les architectures de vision basées uniquement sur des perceptrons multicouches (MLPs) ont attiré beaucoup d'attention dans la communauté de la vision par ordinateur. Les modèles similaires aux MLP obtiennent des performances compétitives pour la classification d'images 2D individuelles avec moins de biais inductif et sans couches de convolution conçues manuellement. Dans ce travail, nous explorons l'efficacité des architectures basées sur les MLP pour la tâche de reconnaissance d'objets 3D basée sur les vues. Nous présentons une architecture basée sur les MLP nommée Round-Roll MLP (R$^2$-MLP). Elle étend le squelette spatial-shift MLP en prenant en compte les communications entre les patches provenant de différentes vues. Le R$^2$-MLP déplace une partie des canaux le long de la dimension des vues et favorise l'échange d'informations entre les vues voisines. Nous évaluons les résultats des MLP sur les jeux de données ModelNet10 et ModelNet40 avec des analyses par suppression dans divers aspects. Les résultats expérimentaux montrent que, grâce à une structure conceptuellement simple, notre R$^2$-MLP atteint des performances compétitives comparables aux méthodes existantes de pointe.