Comprendre le Ré-Classement de la Récupération d'Images : Une Perspective des Réseaux Neuronaux Graphiques

L'approche de réordonnancement (re-ranking) utilise des échantillons récupérés avec une haute confiance pour affiner les résultats de la recherche, et elle est largement adoptée comme outil de post-traitement pour les tâches de recherche d'images. Cependant, nous avons constaté un défaut majeur du réordonnancement, à savoir sa complexité computationnelle élevée, qui entraîne un coût temporel prohibitif pour les applications dans le monde réel. Dans cet article, nous reprenons l'étude du réordonnancement et démontrons que celui-ci peut être reformulé comme une fonction de réseau neuronal graphique (Graph Neural Network, GNN) à haute parallélisme. Plus précisément, nous divisons le processus traditionnel de réordonnancement en deux phases : la récupération d'échantillons de galerie de haute qualité et la mise à jour des caractéristiques. Nous soutenons que la première phase équivaut à construire le graphe des k-plus proches voisins, tandis que la seconde phase peut être considérée comme la propagation du message au sein du graphe. En pratique, le GNN n'a besoin de prendre en compte que les sommets ayant des arêtes connectées. Étant donné que le graphe est clairsemé, nous pouvons mettre à jour efficacement les caractéristiques des sommets. Sur l'ensemble de données Market-1501, nous accélérons le traitement de réordonnancement de 89,2 secondes à 9,4 millisecondes avec une carte graphique K40m, facilitant ainsi le post-traitement en temps réel. De manière similaire, nous observons que notre méthode atteint des résultats comparables ou même supérieurs sur quatre autres bancs d'essai de recherche d'images, à savoir VeRi-776, Oxford-5k, Paris-6k et University-1652, avec un coût temporel limité. Notre code est disponible publiquement.