HyperAIHyperAI
il y a 17 jours

Amélioration des performances des techniques assemblées dans un réseau de neurones convolutionnel

Jungkyu Lee, Taeryun Won, Tae Kwan Lee, Hyemin Lee, Geonmo Gu, Kiho Hong
Amélioration des performances des techniques assemblées dans un réseau de neurones convolutionnel
Résumé

Des études récentes en classification d’images ont mis en évidence diverses techniques visant à améliorer les performances des réseaux de neurones convolutifs (CNN). Toutefois, les tentatives visant à combiner ces techniques existantes afin de construire un modèle pratique restent encore rares. Dans cette étude, nous menons des expériences approfondies afin de démontrer qu’un assemblage soigneux de ces techniques, appliqué à des modèles CNN de base (par exemple ResNet et MobileNet), permet d’améliorer significativement l’exactitude et la robustesse des modèles tout en minimisant la perte de débit d’inférence. Notre modèle assemblé ResNet-50 atteint une amélioration de la précision top-1 passant de 76,3 % à 82,78 % sur l’ensemble de validation ILSVRC2012, une réduction du mCE de 76,0 % à 48,9 % et du mFR de 57,7 % à 32,3 %. Ces progrès sont obtenus tout en faisant chuter le débit d’inférence de 536 à 312 images par seconde. Pour valider l’amélioration des performances dans le cadre du transfer learning, des tests ont été effectués sur plusieurs jeux de données publics pour des tâches de classification fine, de reconnaissance d’images et de recherche d’images, révélant une amélioration notable des performances du transfer learning grâce à l’optimisation du réseau principal. Notre approche a obtenu la première place au concours iFood Competition Fine-Grained Visual Recognition organisé dans le cadre de CVPR 2019. Le code source et les modèles entraînés sont disponibles à l’adresse suivante : https://github.com/clovaai/assembled-cnn