Percevoir où se concentrer : Apprentissage de caractéristiques partielles au niveau des parties avec prise en compte de la visibilité pour la ré-identification partielle de personnes

Ce document aborde un problème réaliste dans la tâche de réidentification des personnes (re-ID), à savoir la réidentification partielle. Dans le cadre de la réidentification partielle, les images peuvent contenir une observation partielle d'un piéton. Si l'on compare directement une image partielle d'un piéton avec une image complète, le décalage spatial extrême compromet considérablement la capacité discriminante de la représentation apprise. Nous proposons un modèle de parties avec prise en compte de la visibilité (Visibility-aware Part Model, VPM), qui apprend à percevoir la visibilité des régions grâce à l'auto-supervision. La prise en compte de la visibilité permet au VPM d'extraire des caractéristiques au niveau des régions et de comparer deux images en se concentrant sur leurs régions partagées (visibles sur les deux images). Le VPM bénéficie ainsi d'une double amélioration pour une meilleure précision en réidentification partielle. D'une part, comparativement à l'apprentissage d'une caractéristique globale, le VPM apprend des caractéristiques au niveau des régions et profite d'informations fines. D'autre part, grâce à la prise en compte de la visibilité, le VPM est capable d'estimer les régions partagées entre deux images et donc de réduire le décalage spatial. Les résultats expérimentaux confirment que notre méthode améliore considérablement la représentation apprise et que la précision obtenue est comparable à celle de l'état de l'art.