HyperAIHyperAI
il y a 19 jours

Apprentissage des caractéristiques uniques des classes dans la classification visuelle fine-grain

Runkai Zheng, Zhijia Yu, Yinqi Zhang, Chris Ding, Hei Victor Cheng, Li Liu
Apprentissage des caractéristiques uniques des classes dans la classification visuelle fine-grain
Résumé

Un défi majeur dans la classification visuelle fine (FGVC) réside dans la capacité à distinguer différentes catégories présentant une forte similarité interclasse, en apprenant des caractéristiques capables de capturer des détails fins. Les réseaux de neurones convolutifs (CNN) entraînés classiquement par entropie croisée échouent à relever ce défi, car ils peuvent produire des caractéristiques invariantes entre classes dans le cadre de la FGVC. Dans ce travail, nous proposons de manière innovante de régulariser l'entraînement des CNN en imposant l'unicité des caractéristiques attribuées à chaque catégorie, sous l’angle de la théorie de l’information. Pour atteindre cet objectif, nous formulons une perte minimax fondée sur un cadre théorique des jeux, dont nous démontrons que l’équilibre de Nash est cohérent avec l’objectif de régularisation. Par ailleurs, afin d’éviter une solution réalisable de la perte minimax qui pourrait entraîner des caractéristiques redondantes, nous introduisons une perte de redondance des caractéristiques (FRL), basée sur le produit scalaire normalisé entre chaque paire de cartes de caractéristiques sélectionnées, afin de compléter la perte minimax proposée. Des résultats expérimentaux supérieurs sur plusieurs benchmarks influents, accompagnés de visualisations, montrent que notre méthode exploite pleinement les performances du modèle de base sans ajouter de coût computationnel, tout en atteignant des résultats comparables à ceux des modèles les plus avancés de l’état de l’art.

Apprentissage des caractéristiques uniques des classes dans la classification visuelle fine-grain | Articles de recherche récents | HyperAI