Analyse de l'impact de différentes fonctions de perte avec la chirurgie du gradient

La perte par paires est une approche d’apprentissage métrique qui consiste à apprendre une représentation sémantique en optimisant une fonction de perte, afin de faire en sorte que les images appartenant à la même classe sémantique soient projetées plus près les unes des autres que celles provenant de classes différentes. La littérature rapporte un ensemble important et en croissance de variantes des stratégies de perte par paires. Dans ce travail, nous décomposons le gradient de ces fonctions de perte en composantes liées à la manière dont elles poussent les positions relatives des caractéristiques des paires « ancrage-positif » et « ancrage-négatif ». Cette décomposition permet d’unifier une large collection de fonctions de perte par paires actuelles. En outre, la construction explicite des mises à jour du gradient par paires, afin d’isoler ces effets, offre des insights sur lesquels exercent le plus grand impact, et conduit à un algorithme simple qui surpasse l’état de l’art pour la recherche d’images sur les jeux de données CAR, CUB et Stanford Online Products.