HyperAIHyperAI
il y a 17 jours

RepVGG : Réveiller le potentiel des ConvNets de type VGG

Xiaohan Ding, Xiangyu Zhang, Ningning Ma, Jungong Han, Guiguang Ding, Jian Sun
RepVGG : Réveiller le potentiel des ConvNets de type VGG
Résumé

Nous présentons une architecture simple mais puissante de réseau de neurones convolutif, dont le corps d'inférence présente une structure inspirée du VGG, composée exclusivement d'une pile de couches de convolution 3×3 et de fonctions d'activation ReLU, tandis que le modèle d'entraînement adopte une topologie à plusieurs branches. Ce découplage entre l'architecture d'entraînement et celle d'inférence est réalisé grâce à une technique de réparamétrisation structurelle, d’où le nom du modèle : RepVGG. Sur ImageNet, RepVGG atteint une précision top-1 supérieure à 80 %, ce qui constitue, à notre connaissance, la première fois qu’un modèle « plat » (sans architecture complexe) parvient à un tel niveau. Sur une GPU NVIDIA 1080Ti, les modèles RepVGG s’exécutent respectivement 83 % plus vite que ResNet-50 ou 101 % plus vite que ResNet-101, tout en offrant une précision supérieure et un compromis précision-vitesse avantageux par rapport aux modèles de pointe tels qu'EfficientNet ou RegNet. Le code source et les modèles entraînés sont disponibles à l’adresse suivante : https://github.com/megvii-model/RepVGG.

RepVGG : Réveiller le potentiel des ConvNets de type VGG | Articles de recherche récents | HyperAI