HyperAIHyperAI
il y a 17 jours

Réseaux de neurones convolutifs profonds avec pooling pondéré spatialement pour la reconnaissance fine des voitures

{Chunhua Shen, Teng Li, Huibing Wang, Qichang Hu}
Résumé

La reconnaissance fine-grain de voitures vise à identifier l'information catégorielle d'un véhicule, telle que la marque, le modèle ou même l'année de fabrication. De nombreuses études récentes ont montré qu'un réseau neuronal convolutif profond (DCNN) entraîné sur un grand ensemble de données peut obtenir des résultats remarquables sur diverses tâches de classification d'objets génériques. Dans cet article, nous proposons une stratégie de pooling pondéré spatialement (SWP), qui améliore considérablement la robustesse et l'efficacité de la représentation des caractéristiques des principaux DCNNs. Plus précisément, le SWP est une nouvelle couche de pooling comprenant un nombre prédéfini de masques pondérés spatialement ou de canaux de pooling. Ce mécanisme exploite les masques appris pour guider le pooling des caractéristiques extraites par le DCNN, en mesurant l'importance des unités spatiales en termes de pouvoir discriminant. Contrairement aux méthodes existantes qui appliquent un pooling sur grille uniforme aux cartes de caractéristiques convolutives des DCNNs, la méthode proposée permet d’extraire les caractéristiques convolutives et de générer les canaux de pooling à partir d’un seul DCNN, nécessitant ainsi une modification minimale dans l’implémentation. En outre, les paramètres de la couche SWP peuvent être appris de manière end-to-end au cours de l’entraînement du DCNN. En appliquant notre méthode à plusieurs jeux de données de reconnaissance fine-grain de voitures, nous démontrons que la méthode proposée atteint des performances supérieures à celles des approches récentes de la littérature. Nous améliorons les résultats de l’état de l’art en passant de 92,6 % à 93,1 % de précision sur le jeu de données Stanford Cars-196, et de 91,2 % à 97,6 % sur le jeu de données récent CompCars. Nous avons également testé la méthode proposée sur deux autres jeux de données à grande échelle, obtenant des résultats remarquables.