HyperAIHyperAI

Command Palette

Search for a command to run...

Revoir les ResNets : des stratégies améliorées d'entraînement et d'échelle

Irwan Bello William Fedus Xianzhi Du Ekin D. Cubuk Aravind Srinivas Tsung-Yi Lin Jonathon Shlens Barret Zoph

Résumé

Les nouvelles architectures de vision par ordinateur attirent l’attention, mais l’impact de l’architecture du modèle est souvent confondu avec les évolutions simultanées des méthodologies d’entraînement et des stratégies d’échelle. Dans ce travail, nous revisitons l’architecture canonique ResNet (He et al., 2015) et étudions ces trois aspects afin de les délier. Peut-être de manière surprenante, nous constatons que les stratégies d’entraînement et d’échelle peuvent avoir une importance supérieure à celle des modifications architecturales, et que les ResNets ainsi obtenus atteignent les performances des modèles les plus récents de l’état de l’art. Nous montrons que la meilleure stratégie d’échelle dépend du régime d’entraînement, et proposons deux nouvelles stratégies : (1) augmenter la profondeur du modèle dans les régimes où le surajustement est possible (une augmentation de la largeur est préférable dans les autres cas) ; (2) augmenter la résolution des images plus lentement que ce qui était recommandé précédemment (Tan & Le, 2019). Grâce à des stratégies améliorées d’entraînement et d’échelle, nous concevons une famille d’architectures ResNet, appelée ResNet-RS, qui est 1,7 à 2,7 fois plus rapide que les EfficientNets sur les TPUs, tout en atteignant des précisions similaires sur ImageNet. Dans un cadre d’apprentissage semi-supervisé à grande échelle, ResNet-RS atteint une précision top-1 de 86,2 % sur ImageNet, tout en étant 4,7 fois plus rapide que EfficientNet NoisyStudent. Les techniques d’entraînement améliorées améliorent également les performances de transfert sur une série de tâches en aval (rivalisant avec les algorithmes auto-supervisés de pointe) et s’étendent à la classification vidéo sur Kinetics-400. Nous recommandons aux praticiens d’utiliser ces ResNets révisés simples comme bases de référence pour les recherches futures.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp