Un comptage précis de voitures dans des images aériennes basé sur des réseaux de neurones convolutifs
Cet article propose un modèle simple et efficace de détection en une seule étape pour détecter et compter les voitures sur des images aériennes. Le modèle proposé, nommé réseau de neurones convolutionnels apprenant les cartes de chaleur (HLCNN, heatmap learner convolutional neural network), vise à prédire la carte de chaleur correspondant aux instances cibles de voitures. Afin d’apprendre la carte de chaleur des voitures cibles, nous avons amélioré l’architecture CNN en remplaçant les couches entièrement connectées par trois couches convolutionnelles agissant comme couches d’adaptation. Le réseau VGG-16 a été utilisé comme architecture fondamentale (backbone) dans le modèle proposé. La méthode proposée parvient ainsi à déterminer avec succès le nombre de voitures tout en détectant précisément leur centre. Des expérimentations menées sur deux jeux de données distincts de voitures (PUCPR+ et CARPK) démontrent que la méthode proposée atteint des performances de comptage et de localisation au niveau de l’état de l’art, surpassant les approches existantes. Des études supplémentaires ont été réalisées afin d’évaluer l’impact de l’augmentation des données et de la normalisation par lots sur la performance du modèle. Le code source et les données seront disponibles à l’adresse suivante : [https://www.github.com/ekilic/Heatmap-Learner-CNN-for-Object-Counting].