HyperAIHyperAI
il y a 2 mois

Réexaminer l'architecture Inception pour la vision par ordinateur

Christian Szegedy; Vincent Vanhoucke; Sergey Ioffe; Jonathon Shlens; Zbigniew Wojna
Réexaminer l'architecture Inception pour la vision par ordinateur
Résumé

Les réseaux de neurones convolutionnels sont au cœur des solutions les plus avancées en vision par ordinateur pour une grande variété de tâches. Depuis 2014, les réseaux de neurones convolutionnels très profonds ont commencé à devenir courants, offrant des gains considérables dans diverses évaluations de référence. Bien que l'augmentation de la taille du modèle et du coût computationnel tende généralement à se traduire par des améliorations immédiates de la qualité pour la plupart des tâches (à condition qu'il y ait suffisamment de données étiquetées pour l'entraînement), l'efficacité computationnelle et un faible nombre de paramètres restent des facteurs déterminants pour divers cas d'utilisation, tels que la vision mobile et les scénarios de grandes données. Dans cette étude, nous explorons des moyens d'échelonner les réseaux en visant à utiliser le calcul supplémentaire aussi efficacement que possible grâce à des convolutions factorisées adaptées et à une régularisation agressive. Nous évaluons nos méthodes sur l'ensemble de validation du défi de classification ILSVRC 2012 et démontrons des gains substantiels par rapport à l'état de l'art : une erreur de 21,2 % en classement premier et de 5,6 % en classement cinquième pour une évaluation mono-image en utilisant un réseau avec un coût computationnel de 5 milliards d'opérations multiplication-ajout par inférence et moins de 25 millions de paramètres. Avec un ensemble de 4 modèles et une évaluation multicoupe, nous rapportons une erreur de 3,5 % en classement cinquième sur l'ensemble de validation (3,6 % d'erreur sur l'ensemble de test) et une erreur de 17,3 % en classement premier sur l'ensemble de validation.

Réexaminer l'architecture Inception pour la vision par ordinateur | Articles de recherche récents | HyperAI