FPB : Branche de pyramide de caractéristiques pour la ré-identification de personnes

La réidentification de personnes (Re-ID) à haute performance exige que le modèle se concentre à la fois sur la silhouette globale et les détails locaux des piétons. Pour extraire des caractéristiques plus représentatives, une approche efficace consiste à exploiter des modèles profonds à plusieurs branches. Toutefois, la plupart des méthodes basées sur des architectures à plusieurs branches, qui reposent sur la duplication de la structure du modèle partiel, entraînent généralement une augmentation sévère du coût computationnel. Dans ce travail, nous proposons une branche de pyramide de caractéristiques légère (Feature Pyramid Branch, FPB), conçue pour extraire des caractéristiques provenant de différentes couches du réseau et les agréger selon une structure pyramidale bidirectionnelle. Grâce à l’association avec des modules d’attention et à la régularisation orthogonale croisée que nous proposons, la FPB améliore significativement les performances du réseau principal tout en ajoutant moins de 1,5 million de paramètres supplémentaires. Des résultats expérimentaux étendus sur des jeux de données standard de référence démontrent que le modèle basé sur notre FPB surpasser les méthodes de pointe avec un écart notable, tout en présentant une complexité de modèle bien moindre. La FPB s’inspire de l’idée du Feature Pyramid Network (FPN), largement utilisé dans les méthodes modernes de détection d’objets. À notre connaissance, il s’agit de la première application réussie d’une structure pyramidale similaire dans les tâches de réidentification de personnes, ce qui prouve empiriquement que les réseaux pyramidaux, lorsqu’ils sont intégrés comme branches annexes, pourraient constituer une architecture prometteuse pour les modèles d’embedding de caractéristiques liés. Le code source est disponible publiquement à l’adresse suivante : https://github.com/anocodetest1/FPB.git.