Couche de Plongement de Variété Itérative Apprise par des Données Incomplètes pour la Recherche d'Images à Grande Échelle

Les méthodes de apprentissage de variétés existantes ne sont pas appropriées pour la tâche de recherche d'images, car la plupart d'entre elles ne peuvent pas traiter les images de requête et présentent un coût computationnel supplémentaire important, en particulier pour les bases de données à grande échelle. Par conséquent, nous proposons une couche d'embedding de variété itératif (IME), dont les poids sont appris hors ligne par une stratégie non supervisée, afin d'explorer les variétés intrinsèques à partir de données incomplètes. Sur une base de données à grande échelle contenant 27 000 images, la couche IME est plus de 120 fois plus rapide que les autres méthodes d'apprentissage de variétés pour embedder les représentations originales au moment des requêtes. Nous embeddons itérativement les descripteurs originaux des images de la base de données, qui se trouvent sur une variété dans un espace à haute dimension, dans des représentations basées sur la variété pour générer les représentations IME lors de l'étape d'apprentissage hors ligne. En fonction des descripteurs originaux et des représentations IME des images de la base de données, nous estimons les poids de la couche IME par régression ridge. Dans l'étape en ligne de recherche, nous utilisons la couche IME pour mapper la représentation originale de l'image de requête avec un coût temporel négligeable (2 millisecondes). Nous avons expérimenté notre méthode sur cinq jeux de données standards publics pour la recherche d'images. La couche IME proposée dépasse significativement les méthodes connexes de réduction de dimensionnalité et d'apprentissage de variétés. Sans post-traitement, notre couche IME améliore les performances des méthodes actuelles de recherche d'images avec post-traitement sur la plupart des jeux de données et nécessite moins de ressources computationnelles.