ProxyNCA++ : Reconsidérer et revitaliser l'Analyse de composantes par voisinage par proxy

Nous abordons le problème de l'apprentissage de métriques de distance (DML), dont l'objectif est d'apprendre une mesure efficace de similarité entre des images. Nous revisitons l'algorithme ProxyNCA et y intégrons plusieurs améliorations. Nous constatons que l'utilisation d'une faible échelle de température constitue un élément crucial pour la performance, et nous expliquons pourquoi ce choix s'avère efficace. Par ailleurs, nous observons que le pooling maximal global (Global Max Pooling) se comporte généralement mieux que le pooling moyen global (Global Average Pooling). En outre, notre proposition de « proxies mobiles rapides » permet de résoudre efficacement le problème des gradients faibles associés aux proxies, et cette composante s'associe harmonieusement à l'échelle de température faible ainsi qu'au Global Max Pooling. Notre modèle amélioré, baptisé ProxyNCA++, atteint une amélioration moyenne de 22,9 points de pourcentage en Recall@1 sur quatre jeux de données différents pour la récupération zéro-shot, par rapport à l'algorithme original ProxyNCA. En outre, nous obtenons des résultats de pointe sur les jeux de données CUB200, Cars196, Sop et InShop, avec des scores de Recall@1 respectivement de 72,2, 90,1, 81,4 et 90,9.