HyperAIHyperAI

Command Palette

Search for a command to run...

Reconnaissance d'endroits à grande échelle à faible consommation de données avec une supervision de similarité hiérarchisée

Maria Leyva-Vallina Nicola Strisciuglio Nicolai Petkov

Résumé

La reconnaissance de lieu visuel (VPR) est une tâche fondamentale de la vision par ordinateur pour la localisation visuelle. Les méthodes existantes sont entraînées à l’aide de paires d’images qui représentent soit le même lieu, soit des lieux différents. Cette indication binaire ne tient pas compte des relations continues de similarité entre des images du même lieu prises depuis des positions différentes, lesquelles sont déterminées par la nature continue de la pose de la caméra. Cette similarité binaire introduit un signal de supervision bruité lors de l’entraînement des méthodes VPR, entraînant des stagnations dans des minima locaux et nécessitant des algorithmes coûteux d’extraction de paires difficiles (hard mining) pour garantir la convergence. Motivés par le fait que deux images du même lieu ne partagent que partiellement des indices visuels en raison des différences de pose de la caméra, nous proposons une stratégie automatique de ré-annotation pour réétiqueter les jeux de données VPR. Nous calculons des étiquettes de similarité graduelle pour les paires d’images à partir des métadonnées de localisation disponibles. En outre, nous introduisons une nouvelle fonction de perte contrastive généralisée (Generalized Contrastive Loss, GCL), qui utilise ces étiquettes de similarité graduelle pour entraîner des réseaux contrastifs. Nous démontrons que l’emploi de ces nouvelles étiquettes et de la GCL permet d’éliminer la nécessité d’extraire des paires difficiles, tout en entraînant des descripteurs d’images qui obtiennent de meilleurs résultats en VPR par recherche de plus proches voisins, atteignant des performances supérieures ou comparables à celles des méthodes nécessitant des algorithmes coûteux d’extraction de paires difficiles et des techniques de ré-évaluation (re-ranking). Le code et les modèles sont disponibles à l’adresse : https://github.com/marialeyvallina/generalized_contrastive_loss


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp