HyperAIHyperAI
il y a 19 jours

Classification visuelle fine à l’aide du raffinement à haute température et de la suppression du fond

Po-Yung Chou, Yu-Yung Kao, Cheng-Hung Lin
Classification visuelle fine à l’aide du raffinement à haute température et de la suppression du fond
Résumé

La classification visuelle fine-grain est une tâche difficile en raison de la forte similarité entre les catégories ainsi que des différences importantes au sein des données appartenant à une même catégorie. Afin de relever ces défis, les approches précédentes se sont concentrées sur la localisation des différences subtiles entre les catégories et l’amélioration des caractéristiques discriminantes associées. Toutefois, le fond fournit également des informations essentielles qui permettent au modèle d’identifier les caractéristiques inutiles ou même nuisibles pour la classification, et les modèles s’appuyant excessivement sur des caractéristiques subtiles risquent de négliger les informations globales et contextuelles. Dans cet article, nous proposons un nouveau réseau appelé « High-temperature Refinement and Background Suppression » (HERBS), composé de deux modules : un module de raffinement à haute température et un module de suppression du fond, destinés respectivement à extraire des caractéristiques discriminantes et à supprimer le bruit de fond. Le module de raffinement à haute température permet au modèle d’apprendre les échelles de caractéristiques appropriées en affinant la carte de caractéristiques à différentes échelles et en améliorant l’apprentissage de caractéristiques diversifiées. Quant au module de suppression du fond, il divise initialement la carte de caractéristiques en régions de premier plan et de fond à l’aide de scores de confiance de classification, puis supprime les valeurs de caractéristiques dans les zones à faible confiance tout en renforçant les caractéristiques discriminantes. Les résultats expérimentaux montrent que HERBS fusionne efficacement des caractéristiques à différentes échelles, supprime le bruit de fond et extrait des caractéristiques discriminantes à des échelles appropriées pour la classification visuelle fine-grain. La méthode proposée atteint des performances de pointe sur les benchmarks CUB-200-2011 et NABirds, dépassant 93 % de précision sur les deux jeux de données. Ainsi, HERBS s’impose comme une solution prometteuse pour améliorer les performances des tâches de classification visuelle fine-grain. Code : https://github.com/chou141253/FGVC-HERBS