HyperAIHyperAI
il y a 2 mois

CSRNet : Réseaux de neurones convolutifs dilatés pour la compréhension des scènes très congestionnées

Yuhong Li; Xiaofan Zhang; Deming Chen
CSRNet : Réseaux de neurones convolutifs dilatés pour la compréhension des scènes très congestionnées
Résumé

Nous proposons un réseau pour la reconnaissance de scènes congestionnées appelé CSRNet, qui fournit une méthode basée sur les données et l'apprentissage profond capable de comprendre des scènes très congestionnées et d'effectuer des estimations de comptage précises ainsi que de présenter des cartes de densité de haute qualité. Le CSRNet proposé est composé de deux composants principaux : un réseau neuronal convolutif (CNN) en tant que front-end pour l'extraction de caractéristiques 2D et un CNN dilaté pour le back-end, qui utilise des noyaux dilatés pour offrir des champs récepteurs plus larges et remplacer les opérations de pooling. CSRNet est un modèle facile à entraîner grâce à sa structure purement convolutive. Nous démontrons les performances du CSRNet sur quatre jeux de données (jeu de données ShanghaiTech, jeu de données UCF_CC_50, jeu de données WorldEXPO'10 et jeu de données UCSD) et nous obtenons des résultats d'état de l'art. Dans le sous-ensemble Part_B du jeu de données ShanghaiTech, CSRNet atteint une erreur absolue moyenne (MAE) 47,3% plus faible que la méthode précédente d'état de l'art. Nous étendons les applications ciblées pour le comptage d'autres objets, tels que les véhicules dans le jeu de données TRANCOS. Les résultats montrent que CSRNet améliore considérablement la qualité des sorties avec une MAE 15,4% plus faible que l'approche précédente d'état de l'art.

CSRNet : Réseaux de neurones convolutifs dilatés pour la compréhension des scènes très congestionnées | Articles de recherche récents | HyperAI