HyperAIHyperAI
il y a 18 jours

Pièces spécifiques à la classification pour améliorer la catégorisation visuelle fine

Dimitri Korsch, Paul Bodesheim, Joachim Denzler
Pièces spécifiques à la classification pour améliorer la catégorisation visuelle fine
Résumé

La catégorisation visuelle fine-grain est une tâche de classification visant à distinguer des catégories présentant une forte variance intra-classe et une faible variance inter-classe. Alors que les approches globales s'appuient sur l'image entière pour effectuer la classification, les méthodes basées sur les parties exploitent des informations locales supplémentaires sous forme d'attentions ou de régions partielles. Nous proposons une nouvelle méthode d'estimation de parties spécifique à la classification, qui utilise une prédiction initiale ainsi que la rétropropagation de l'importance des caractéristiques via des calculs de gradients afin d'estimer les régions pertinentes de l'image. Les parties ainsi détectées ne sont pas seulement sélectionnées à l'aide de connaissances a posteriori issues de la classification, mais possèdent également une étendue spatiale intrinsèque déterminée automatiquement. Ceci contraste avec la plupart des approches basées sur les parties, ainsi qu'avec les annotations de référence disponibles, qui ne fournissent que des coordonnées ponctuelles sans information supplémentaire sur l'échelle. Nos expériences sur diverses bases de données largement utilisées pour la catégorisation fine-grain démontrent l'efficacité de la méthode proposée pour la sélection des parties, en combinaison avec les caractéristiques extraites à partir de ces régions.