HyperAIHyperAI
il y a 11 jours

Revoir les ResNets : des stratégies améliorées d'entraînement et d'échelle

Irwan Bello, William Fedus, Xianzhi Du, Ekin D. Cubuk, Aravind Srinivas, Tsung-Yi Lin, Jonathon Shlens, Barret Zoph
Revoir les ResNets : des stratégies améliorées d'entraînement et d'échelle
Résumé

Les nouvelles architectures de vision par ordinateur attirent l’attention, mais l’impact de l’architecture du modèle est souvent confondu avec les évolutions simultanées des méthodologies d’entraînement et des stratégies d’échelle. Dans ce travail, nous revisitons l’architecture canonique ResNet (He et al., 2015) et étudions ces trois aspects afin de les délier. Peut-être de manière surprenante, nous constatons que les stratégies d’entraînement et d’échelle peuvent avoir une importance supérieure à celle des modifications architecturales, et que les ResNets ainsi obtenus atteignent les performances des modèles les plus récents de l’état de l’art. Nous montrons que la meilleure stratégie d’échelle dépend du régime d’entraînement, et proposons deux nouvelles stratégies : (1) augmenter la profondeur du modèle dans les régimes où le surajustement est possible (une augmentation de la largeur est préférable dans les autres cas) ; (2) augmenter la résolution des images plus lentement que ce qui était recommandé précédemment (Tan & Le, 2019). Grâce à des stratégies améliorées d’entraînement et d’échelle, nous concevons une famille d’architectures ResNet, appelée ResNet-RS, qui est 1,7 à 2,7 fois plus rapide que les EfficientNets sur les TPUs, tout en atteignant des précisions similaires sur ImageNet. Dans un cadre d’apprentissage semi-supervisé à grande échelle, ResNet-RS atteint une précision top-1 de 86,2 % sur ImageNet, tout en étant 4,7 fois plus rapide que EfficientNet NoisyStudent. Les techniques d’entraînement améliorées améliorent également les performances de transfert sur une série de tâches en aval (rivalisant avec les algorithmes auto-supervisés de pointe) et s’étendent à la classification vidéo sur Kinetics-400. Nous recommandons aux praticiens d’utiliser ces ResNets révisés simples comme bases de référence pour les recherches futures.

Revoir les ResNets : des stratégies améliorées d'entraînement et d'échelle | Articles de recherche récents | HyperAI