HyperAIHyperAI
il y a 3 mois

Correction du décalage de résolution entre entraînement et test : FixEfficientNet

Hugo Touvron, Andrea Vedaldi, Matthijs Douze, Hervé Jégou
Correction du décalage de résolution entre entraînement et test : FixEfficientNet
Résumé

Cet article présente une analyse approfondie des performances des classificateurs d’images EfficientNet lorsqu’ils sont entraînés avec plusieurs procédés récents, en particulier un qui corrige le déséquilibre entre les images utilisées pour l’entraînement et celles utilisées pour l’évaluation. Le réseau résultant, baptisé FixEfficientNet, surpasse significativement l’architecture initiale pour un nombre équivalent de paramètres.Par exemple, notre FixEfficientNet-B0, entraîné sans données supplémentaires, atteint une précision top-1 de 79,3 % sur ImageNet avec 5,3 millions de paramètres. Il s’agit d’une amélioration absolue de +0,5 % par rapport à EfficientNet-B0 Noisy Student, entraîné avec 300 millions d’images non étiquetées. Un EfficientNet-L2 pré-entraîné avec une supervision faible sur 300 millions d’images non étiquetées, puis optimisé avec FixRes, atteint quant à lui une précision top-1 de 88,5 % (top-5 : 98,7 %), établissant ainsi un nouveau record mondial pour ImageNet dans le cadre d’une seule prévision (single crop).Ces améliorations sont rigoureusement évaluées selon des protocoles plus propres que ceux habituellement utilisés pour ImageNet, notamment en montrant que notre gain de performance se maintient dans le cadre expérimental d’ImageNet-v2 — moins sujet au surapprentissage — ainsi qu’avec les étiquettes réelles d’ImageNet (ImageNet Real Labels). Dans les deux cas, nous établissons également un nouveau record mondial.