HyperAIHyperAI
il y a 17 jours

Distillation de self-attention complète pour la détection d'objets faiblement supervisée

Zeyi Huang, Yang Zou, Vijayakumar Bhagavatula, Dong Huang
Distillation de self-attention complète pour la détection d'objets faiblement supervisée
Résumé

La détection d’objets faiblement supervisée (WSOD) s’est imposée comme un outil efficace pour entraîner des détecteurs d’objets à l’aide uniquement d’étiquettes de catégorie au niveau de l’image. Toutefois, en l’absence d’étiquettes au niveau de l’objet, les détecteurs WSOD sont sujets à localiser des boîtes englobantes sur des objets saillants, des objets regroupés ou des parties discriminantes d’objets. En outre, les étiquettes au niveau de l’image ne garantissent pas une détection d’objets cohérente à travers différentes transformations de la même image. Pour résoudre ces problèmes, nous proposons une méthode d’entraînement appelée Auto-Enseignement par Attention Complète (CASD) pour la WSOD. Afin d’équilibrer l’apprentissage des caractéristiques entre toutes les instances d’objets, CASD calcule une attention complète agrégée à partir de plusieurs transformations et couches de caractéristiques de la même image. Pour imposer une supervision spatiale cohérente sur les objets, CASD met en œuvre une auto-enseignement sur les réseaux WSOD, de manière à ce que l’attention complète soit approximée simultanément par plusieurs transformations et couches de caractéristiques de la même image. CASD obtient de nouveaux résultats d’état de l’art sur des benchmarks standards tels que PASCAL VOC 2007/2012 et MS-COCO.

Distillation de self-attention complète pour la détection d'objets faiblement supervisée | Articles de recherche récents | HyperAI