Amélioration adaptative du canal de caractéristiques pour la classification visuelle fine-grain
La classification fine-grained pose des défis plus importants que la classification d’image au niveau fondamental en raison des sous-espèces visuellement similaires. Pour distinguer entre des espèces confondantes, nous proposons un cadre novateur basé sur une amélioration adaptative des canaux de caractéristiques et une suppression d’attention. D’une part, un module léger utilisant à la fois l’attention sur les canaux et l’attention spatiale est conçu afin d’améliorer de manière adaptative l’expression des caractéristiques dans les régions pertinentes, permettant ainsi d’obtenir des vecteurs de caractéristiques plus discriminants. D’autre part, nous intégrons des méthodes de suppression d’attention qui obligent le réseau à se concentrer sur des zones moins marquées, renforçant ainsi la robustesse du modèle. Notre méthode peut être facilement intégrée à diverses architectures de réseaux de base (backbone). Enfin, une évaluation de notre approche est réalisée sur plusieurs jeux de données publics variés, accompagnée d’une analyse comparative exhaustive par rapport aux méthodes de pointe. Les résultats expérimentaux confirment l’efficacité et la faisabilité de notre méthode dans des scénarios réels, illustrant des avancées notables dans les tâches complexes de classification fine-grained.