HyperAIHyperAI
il y a 2 mois

ADCrowdNet : Un réseau convolutif déformable injectant de l'attention pour la compréhension des foules

Ning Liu; Yongchao Long; Changqing Zou; Qun Niu; Li Pan; Hefeng Wu
ADCrowdNet : Un réseau convolutif déformable injectant de l'attention pour la compréhension des foules
Résumé

Nous proposons un réseau de convolution déformable à injection d'attention appelé ADCrowdNet pour la compréhension des foules, capable de résoudre le problème de dégradation de précision dans les scènes bruyantes et très encombrées. ADCrowdNet comprend deux réseaux concaténés. Un réseau sensible à l'attention, nommé Générateur de Carte d'Attention (AMG), détecte d'abord les régions de foule dans les images et calcule le degré d'encombrement de ces régions. Sur la base des régions de foule détectées et des a priori d'encombrement, un réseau multi-échelle déformable, appelé Estimateur de Carte de Densité (DME), génère ensuite des cartes de densité de haute qualité. Grâce au schéma d'entraînement sensible à l'attention et au schéma convolutif multi-échelle déformable, le réseau ADCrowdNet proposé atteint une capacité plus efficace pour capturer les caractéristiques des foules et une meilleure résistance aux divers bruits. Nous avons évalué notre méthode sur quatre ensembles de données populaires pour le comptage des foules (ShanghaiTech, UCF_CC_50, WorldEXPO'10 et UCSD) ainsi que sur un ensemble de données supplémentaire pour le comptage des véhicules TRANCOS, et notre approche surpassant les méthodes existantes les plus avancées sur tous ces ensembles de données.

ADCrowdNet : Un réseau convolutif déformable injectant de l'attention pour la compréhension des foules | Articles de recherche récents | HyperAI