Détection d'objets semi-supervisée avec auto-entraînement rééquilibrant adaptatif des classes

Cette étude explore la détection d'objets semi-supervisée (SSOD) afin d'améliorer les performances des détecteurs grâce à l'ajout de données non étiquetées. Les performances les plus avancées en SSOD ont récemment été atteintes grâce à l'auto-entraînement, dans lequel la supervision d'entraînement repose à la fois sur les vérités terrain et sur des pseudo-étiquettes. Dans les travaux actuels, nous observons que l'imbalance de classes en SSOD entrave sévèrement l'efficacité de l'auto-entraînement. Pour atténuer ce problème, nous proposons une méthode d'auto-entraînement à rééquilibrage adaptatif des classes (ACRST), basée sur un nouveau module mémoire appelé CropBank. ACRST rééquilibre de manière adaptative les données d'entraînement en extrayant des instances d'objets (foreground) depuis le CropBank, ce qui contribue à atténuer l'imbalance de classes. Étant donné la complexité élevée des tâches de détection, nous constatons que tant l'auto-entraînement que le rééquilibrage des données souffrent de pseudo-étiquettes bruitées en SSOD. Par conséquent, nous proposons un nouvel algorithme de filtrage en deux étapes pour générer des pseudo-étiquettes précises. Notre méthode obtient des améliorations satisfaisantes sur les benchmarks MS-COCO et VOC. Lorsqu'elle utilise uniquement 1 % de données étiquetées sur MS-COCO, elle atteint une amélioration de 17,02 points de mAP par rapport aux méthodes supervisées, et une amélioration de 5,32 points de mAP par rapport aux méthodes de l'état de l'art.