HyperAIHyperAI
il y a 11 jours

Attention au fossé : Affinement des étiquettes pseudo-labels pour une détection d'objets semi-supervisée précise

Lei Zhang, Yuxuan Sun, Wei Wei
Attention au fossé : Affinement des étiquettes pseudo-labels pour une détection d'objets semi-supervisée précise
Résumé

L’exploitation des étiquettes pseudo-labels (par exemple, catégories et boîtes englobantes) d’objets non annotés produites par un détecteur enseignant a été au cœur de nombreux progrès récents dans le domaine de la détection d’objets semi-supervisée (SSOD). Toutefois, en raison de la capacité de généralisation limitée du détecteur enseignant, souvent due à l’insuffisance des annotations disponibles, les pseudo-étiquettes générées s’écartent fréquemment des vérités terrain, en particulier celles associées à des confiances de classification faibles, ce qui entrave la performance de généralisation du modèle SSOD. Pour atténuer ce problème, nous proposons un cadre de polissage à double pseudo-étiquettes pour la SSOD. Au lieu d’utiliser directement les pseudo-étiquettes produites par le détecteur enseignant, nous introduisons une première approche visant à réduire leur écart par rapport aux vérités terrain grâce à un apprentissage de polissage dual. Deux réseaux de polissage, structurellement distincts, sont soigneusement conçus et entraînés séparément à l’aide de paires synthétisées de pseudo-étiquettes et des vérités terrain correspondantes pour les catégories et les boîtes englobantes, respectivement, sur des objets annotés. Grâce à cette stratégie, les deux réseaux de polissage peuvent inférer des pseudo-étiquettes plus précises pour les objets non annotés en exploitant pleinement leurs connaissances contextuelles à partir des pseudo-étiquettes initiales, améliorant ainsi la performance de généralisation du modèle SSOD. En outre, ce schéma peut être intégré de manière transparente dans les cadres existants de SSOD pour permettre un apprentissage end-to-end conjoint. Par ailleurs, nous proposons de désentrelacer les pseudo-catégories et les boîtes englobantes polies des objets non annotés, afin de traiter séparément la classification de catégorie et la régression de boîtes englobantes dans le cadre SSOD. Cette approche permet d’introduire davantage d’objets non annotés pendant l’entraînement, conduisant à une amélioration supplémentaire des performances. Des expériences menées sur les benchmarks PASCAL VOC et MS COCO démontrent clairement l’avantage de la méthode proposée par rapport aux états de l’art existants.

Attention au fossé : Affinement des étiquettes pseudo-labels pour une détection d'objets semi-supervisée précise | Articles de recherche récents | HyperAI