HyperAIHyperAI
il y a 18 jours

Intégration d'Insights : Interaction de Caractéristiques de Haut Ordre pour la Reconnaissance Visuelle Fine

{Amr Ahmed & Ardhendu Behera, Yitian Zhao, Siddhardha Kedarisetty, Yonghuai Liu, Arindam Sikdar}
Résumé

Ce papier présente une nouvelle approche pour la classification visuelle fine (FGVC) fondée sur l’exploration des réseaux de neurones graphiques (GNN) afin de favoriser les interactions de caractéristiques d’ordre supérieur, en mettant particulièrement l’accent sur la construction de graphes inter-région et intra-région. Contrairement aux méthodes FGVC antérieures qui isolent souvent les caractéristiques globales et locales, notre méthode intègre de manière fluide ces deux types de caractéristiques pendant l’apprentissage grâce à une représentation graphique. Les graphes inter-région captent les dépendances à longue portée pour reconnaître des motifs globaux, tandis que les graphes intra-région explorent des détails fins au sein de régions spécifiques d’un objet en analysant des caractéristiques convolutionnelles de haute dimension. Une innovation clé réside dans l’utilisation de GNN partagés munis d’un mécanisme d’attention combiné à l’algorithme de propagation d’information APPNP (Approximate Personalized Propagation of Neural Predictions), ce qui améliore l’efficacité de la propagation d’information, renforce la discriminabilité et simplifie l’architecture du modèle pour une meilleure efficacité computationnelle. Par ailleurs, l’introduction de connexions résiduelles améliore à la fois les performances et la stabilité de l’apprentissage. Des expériences approfondies démontrent des résultats de pointe sur des jeux de données standardisés FGVC, confirmant l’efficacité de notre approche. Ce travail souligne le potentiel des GNN pour modéliser les interactions de haut niveau entre caractéristiques, se distinguant ainsi des méthodes FGVC antérieures qui se concentrent souvent sur un aspect unique de la représentation des caractéristiques. Le code source de notre travail est disponible à l’adresse suivante : https://github.com/Arindam-1991/I2-HOFI.

Intégration d'Insights : Interaction de Caractéristiques de Haut Ordre pour la Reconnaissance Visuelle Fine | Articles de recherche récents | HyperAI