HyperAIHyperAI
il y a 11 jours

Repenser la voie vers la localisation d'objets faiblement supervisée

Chen-Lin Zhang, Yun-Hao Cao, Jianxin Wu
Repenser la voie vers la localisation d'objets faiblement supervisée
Résumé

La localisation d'objets faiblement supervisée (WSOL) vise à localiser des objets à l’aide uniquement d’étiquettes au niveau de l’image. Les méthodes précédentes tentaient souvent d’utiliser les cartes de caractéristiques et les poids de classification pour localiser les objets de manière indirecte à partir d’étiquettes au niveau de l’image. Dans cet article, nous démontrons que la localisation d’objets faiblement supervisée devrait être décomposée en deux composantes : la localisation d’objets sans tenir compte de la classe, et la classification d’objets. Pour la localisation d’objets sans tenir compte de la classe, il convient d’employer des méthodes indépendantes de la classe afin de générer des annotations pseudo-étiquetées bruitées, puis d’effectuer une régression de boîtes englobantes sur ces annotations sans recourir aux étiquettes de classe. Nous proposons une nouvelle méthode, appelée localisation d’objets pseudo-supervisée (PSOL), pour résoudre le problème de WSOL. Nos modèles PSOL présentent une excellente transférabilité entre différents jeux de données sans nécessiter de fine-tuning. Grâce aux boîtes englobantes pseudo-étiquetées générées, nous atteignons une précision de localisation de 58,00 % sur ImageNet et de 74,97 % sur CUB-200, des résultats qui dépassent largement ceux des modèles précédents.

Repenser la voie vers la localisation d'objets faiblement supervisée | Articles de recherche récents | HyperAI