HyperAIHyperAI

Command Palette

Search for a command to run...

ConvMLP : MLPs hiérarchiques à convolution pour la vision

Jiachen Li Ali Hassani Steven Walton Humphrey Shi

Résumé

Les architectures basées sur les MLP, qui se composent d'une suite de blocs de perceptrons multicouches consécutifs, ont récemment montré des performances comparables à celles des méthodes basées sur les réseaux de convolution et les transformateurs. Toutefois, la plupart d'entre elles utilisent des MLP spatiaux prenant en entrée des données de dimension fixe, ce qui rend leur application difficile aux tâches en aval telles que la détection d'objets et la segmentation sémantique. En outre, les architectures à une seule étape limitent davantage les performances dans d'autres tâches de vision par ordinateur, tandis que les couches entièrement connectées entraînent une charge computationnelle importante. Pour surmonter ces limitations, nous proposons ConvMLP : un MLP hiérarchique basé sur la convolution pour la reconnaissance visuelle, conçu de manière intégrée et légère, avec une architecture par étapes combinant des couches de convolution et des MLP. En particulier, ConvMLP-S atteint une précision top-1 de 76,8 % sur ImageNet-1k avec seulement 9 millions de paramètres et 2,4 G de MACs (respectivement 15 % et 19 % de ceux de MLP-Mixer-B/16). Des expériences menées sur la détection d'objets et la segmentation sémantique montrent également que les représentations visuelles apprises par ConvMLP peuvent être transférées de manière transparente et atteindre des résultats compétitifs avec un nombre réduit de paramètres. Le code source et les modèles pré-entraînés sont disponibles publiquement à l'adresse suivante : https://github.com/SHI-Labs/Convolutional-MLPs.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
ConvMLP : MLPs hiérarchiques à convolution pour la vision | Articles | HyperAI