HyperAIHyperAI
il y a 2 mois

Combinaison de descripteurs globaux multiples pour la recherche d'images

HeeJae Jun; Byungsoo Ko; Youngjoon Kim; Insik Kim; Jongtack Kim
Combinaison de descripteurs globaux multiples pour la recherche d'images
Résumé

Des études récentes dans le domaine de la recherche d'images ont montré que l'agrégation de différents modèles et la combinaison de plusieurs descripteurs globaux entraînent une amélioration des performances. Cependant, former différents modèles pour l'agrégation est non seulement difficile mais aussi inefficace en termes de temps et de mémoire. Dans cet article, nous proposons un cadre novateur qui exploite plusieurs descripteurs globaux pour obtenir un effet d'agrégation tout en pouvant être formé de manière end-to-end. Le cadre proposé est flexible et extensible par le descripteur global, le backbone CNN, la fonction de perte et le jeu de données. De plus, nous examinons l'efficacité de la combinaison de plusieurs descripteurs globaux à travers une analyse quantitative et qualitative. Nos expériences approfondies montrent que le descripteur combiné surpasse un seul descripteur global, car il peut utiliser différentes propriétés de caractéristiques. Dans l'évaluation sur les benchmarks, le cadre proposé atteint les meilleures performances actuelles sur CARS196, CUB200-2011, In-shop Clothes et Stanford Online Products pour les tâches de recherche d'images. Nos implémentations de modèle et nos modèles préformés sont disponibles au public.