AG-ReID.v2 : Comblement de l'écart entre les vues aériennes et terrestres pour la réidentification de personnes

La réidentification de personnes (Re-ID) aérienne-sol présente des défis uniques en vision par ordinateur, découlant des différences marquées entre les points de vue, les poses et les résolutions observés par des caméras aériennes à haute altitude et des caméras au sol. La recherche existante se concentre principalement sur la correspondance au sol, tandis que la correspondance aérienne reste peu explorée en raison du manque de jeux de données complets. Pour pallier ce manque, nous introduisons AG-ReID.v2, un jeu de données spécifiquement conçu pour la réidentification de personnes dans des scénarios mixtes aériens et terrestres. Ce jeu de données comprend 100 502 images provenant de 1 615 individus uniques, chacune annotée avec un identifiant de correspondance et 15 étiquettes d’attributs souples. Les données ont été collectées à partir de perspectives diverses à l’aide d’un drone (UAV), de caméras de surveillance fixes (CCTV) et de caméras intégrées à des lunettes intelligentes, offrant ainsi une grande variété de variations intra-identitaires. Par ailleurs, nous avons développé un réseau d’attention explicite adapté à ce jeu de données. Ce réseau repose sur une architecture à trois flux, qui traite efficacement les distances entre paires d’images, met en avant les caractéristiques top-down clés et s’adapte aux variations d’apparence dues aux différences d’altitude. Des évaluations comparatives démontrent l’efficacité supérieure de notre approche par rapport aux méthodes de référence existantes. Nous prévoyons de rendre publiquement disponible le jeu de données ainsi que le code source de l’algorithme, dans l’objectif d’encourager les progrès dans ce domaine spécialisé de la vision par ordinateur. Pour accéder aux ressources, veuillez visiter : https://github.com/huynguyen792/AG-ReID.v2.