HyperAIHyperAI
il y a 17 jours

Approche d'annotation basée sur l'image et partiellement catégorique pour la reconnaissance des attributs des piétons

{Ahmad Kalhor, Mehdi Tale Masouleh, Seraj Ghasemi, Shayan Samiee, Farbod Siahkali, Hossein Bodaghi}
Résumé

Les recherches textuelles peuvent être intégrées à un système de surveillance de réidentification de personnes (re-ID) grâce à la reconnaissance d’attributs piétons (PAR). L’ajout d’un module PAR basé sur un réseau de neurones convolutifs (CNN) à un modèle de re-ID s’avère efficace pour les deux tâches, bien que peu d’approches se soient concentrées sur la modification des données plutôt que celle du modèle pour améliorer les résultats. Sans tenir compte du coût de calcul, de la complexité de déploiement ou de la généralisabilité, la plupart des méthodes multi-tâches actuelles cherchent à surpasser les méthodes antérieures en proposant de nouveaux modèles et architectures sur des jeux de données fixes. Afin d’évaluer l’impact des données sur les performances de la PAR, cette étude propose un nouveau jeu de données catégorique partiellement annoté à partir d’images (CA-Duke), comprenant 36 411 images issues du dataset DukeMTMC-reID, annotées pour 74 attributs de piétons. Toutefois, une approche systématique pour déterminer l’emplacement optimal d’ajout de nouvelles branches reste encore inconnue, car les méthodes actuelles choisissent cet emplacement sur les modèles de base par un processus expérimental. Afin d’identifier le meilleur emplacement pour intégrer un module PAR à un réseau pré-entraîné pour la re-ID, cette étude propose également une méthode d’apprentissage en deux étapes, fondée sur un nouvel indicateur appelé l’Indice de Séparation (SI), permettant d’évaluer la séparabilité des données dans l’espace latente. Enfin, des expérimentations étendues sur la reconnaissance d’attributs et la récupération d’images montrent que des annotations complètes et basées sur des images peuvent améliorer la performance du réseau de 3,31 % en termes de métrique F1. De plus, l’Indice de Séparation (SI) combiné à des réseaux pré-entraînés permet d’atteindre des performances de pointe dans la tâche de reconnaissance d’attributs piétons.

Approche d'annotation basée sur l'image et partiellement catégorique pour la reconnaissance des attributs des piétons | Articles de recherche récents | HyperAI