HyperAIHyperAI
il y a 17 jours

Échantillonnage aléatoire sélectionné pour la reconnaissance d’images à granularité fine

{ Jianbin Jiao, Qixiang Ye, Yi Zhu, Yanzhao Zhou, Yao Ding}
Échantillonnage aléatoire sélectionné pour la reconnaissance d’images à granularité fine
Résumé

La reconnaissance fine présente le défi unique de capturer des différences subtiles entre classes malgré des variations importantes au sein d’une même classe (par exemple, le bec chez les espèces d’oiseaux). Les approches classiques consistent à découper des régions locales et à apprendre des représentations détaillées à partir de ces régions, mais elles souffrent d’un nombre fixe de parties et de la perte du contexte environnant. Dans cet article, nous proposons un cadre simple mais efficace, appelé échantillonnage sparse sélectif, permettant de capturer des détails variés et fins. Ce cadre est mis en œuvre à l’aide de réseaux de neurones convolutifs, désignés sous le nom de Réseaux d’échantillonnage sparse sélectif (S3N). Grâce à une supervision au niveau de l’image, les S3N extraient les pics, c’est-à-dire les maxima locaux, à partir des cartes de réponse par classe afin d’estimer des champs réceptifs informatifs et d’apprendre un ensemble d’attention éparse, permettant de capturer des preuves visuelles détaillées tout en préservant le contexte. Ces preuves sont ensuite échantillonnées de manière sélective pour extraire des caractéristiques discriminantes et complémentaires, enrichissant ainsi significativement la représentation apprise et guidant le réseau vers la découverte de signaux plus subtils. Des expériences étendues et des études d’ablation montrent que la méthode proposée surpasse de manière cohérente les méthodes de pointe sur des benchmarks exigeants tels que CUB-200-2011, FGVC-Aircraft et Stanford Cars.

Échantillonnage aléatoire sélectionné pour la reconnaissance d’images à granularité fine | Articles de recherche récents | HyperAI