HyperAIHyperAI
il y a 2 mois

Amélioration de la reconnaissance des attributs piétons avec une localisation spécifique multi-échelle faiblement supervisée

Chufeng Tang; Lu Sheng; Zhaoxiang Zhang; Xiaolin Hu
Amélioration de la reconnaissance des attributs piétons avec une localisation spécifique multi-échelle faiblement supervisée
Résumé

La reconnaissance des attributs piétons est un sujet de recherche émergent dans le domaine de la vidéosurveillance. Pour prédire l'existence d'un attribut particulier, il est nécessaire de localiser les régions associées à cet attribut. Cependant, dans cette tâche, les annotations de régions ne sont pas disponibles. La façon de segmenter ces régions liées aux attributs reste donc un défi. Les méthodes existantes ont appliqué une attention visuelle indifférenciée aux attributs ou des mécanismes heuristiques de localisation des parties du corps pour améliorer les représentations des caractéristiques locales, tout en négligeant l'utilisation des attributs pour définir les zones de caractéristiques locales. Nous proposons un module de localisation d'attributs (Attribute Localization Module, ALM) flexible qui permet de découvrir de manière adaptative les régions les plus discriminantes et d'apprendre les caractéristiques régionales pour chaque attribut à plusieurs niveaux. De plus, une architecture en pyramide de caractéristiques est également introduite pour renforcer la localisation spécifique aux attributs aux niveaux inférieurs grâce à la guidance sémantique des niveaux supérieurs. Le cadre proposé ne nécessite pas d'annotations supplémentaires de régions et peut être entraîné bout à bout avec une supervision profonde à plusieurs niveaux. Des expériences approfondies montrent que la méthode proposée obtient des résultats d'état de l'art sur trois jeux de données d'attributs piétons, notamment PETA, RAP et PA-100K.

Amélioration de la reconnaissance des attributs piétons avec une localisation spécifique multi-échelle faiblement supervisée | Articles de recherche récents | HyperAI