HyperAIHyperAI
il y a 2 mois

HydraPlus-Net : Caractéristiques profondes attentives pour l'analyse piétonne

Xihui Liu; Haiyu Zhao; Maoqing Tian; Lu Sheng; Jing Shao; Shuai Yi; Junjie Yan; Xiaogang Wang
HydraPlus-Net : Caractéristiques profondes attentives pour l'analyse piétonne
Résumé

L'analyse piétonnière joue un rôle crucial dans la vidéosurveillance intelligente et est un élément clé des systèmes de vision par ordinateur axés sur la sécurité. Bien que les réseaux neuronaux convolutifs soient remarquables pour l'apprentissage de caractéristiques discriminantes à partir d'images, l'apprentissage de caractéristiques exhaustives des piétons pour des tâches fines reste un problème ouvert. Dans cette étude, nous proposons un nouveau réseau neuronal profond basé sur l'attention, nommé HydraPlus-Net (HP-net), qui alimente les cartes d'attention multivariées à différents niveaux de couches de caractéristiques. Les caractéristiques profondes attentives apprises grâce au HP-net offrent des avantages uniques : (1) le modèle est capable de capturer plusieurs attentions, du niveau basique au niveau sémantique, et (2) il explore la sélectivité multiscalaire des caractéristiques attentives pour enrichir les représentations finales des caractéristiques d'une image piétonnière. Nous démontrons l'efficacité et la généralité du HP-net proposé pour l'analyse piétonnière sur deux tâches, à savoir la reconnaissance d'attributs piétons et la réidentification de personnes. Des résultats expérimentaux approfondis sont fournis pour prouver que le HP-net surpassent les méthodes de pointe sur divers ensembles de données.