Consistent-Teacher : Vers la réduction des pseudo-cibles incohérentes dans la détection d'objets semi-supervisée

Dans cette étude, nous explorons en profondeur l'incohérence des pseudo-cibles dans la détection d'objets semi-supervisée (SSOD). Notre observation centrale est que les pseudo-cibles oscillantes compromettent l'entraînement d'un détecteur précis, en introduisant du bruit dans l'entraînement du modèle étudiant et entraînant ainsi de graves problèmes de surapprentissage. Ainsi, nous proposons une solution systématique, nommée ConsistentTeacher, visant à réduire cette incohérence. Premièrement, une affectation adaptative des ancres (ASA) remplace la stratégie statique basée sur l'IoU, permettant au réseau étudiant de résister aux boîtes englobantes pseudo-étiquetées bruitées. Ensuite, nous calibrer les prédictions des sous-tâches en concevant un module d'alignement de caractéristiques en 3D (FAM-3D), qui permet à chaque vecteur de caractéristiques de classification de requérir de manière adaptative le vecteur optimal pour la tâche de régression, à n'importe quelle échelle et position. Enfin, un modèle à mélanges gaussiens (GMM) ajuste dynamiquement le seuil de score des pseudo-boîtes englobantes, stabilisant ainsi le nombre de vérités terrain dès les premières étapes d'entraînement et corrigeant le signal de supervision fiable durant l'apprentissage. ConsistentTeacher obtient des résultats remarquables sur une large gamme d'évaluations SSOD. Avec un squelette ResNet-50 et seulement 10 % des données annotées du jeu de données MS-COCO, il atteint un mAP de 40,0, surpassant ainsi les méthodes précédentes utilisant des pseudo-étiquettes d'environ 3 mAP. Lorsqu'il est entraîné sur l'ensemble complet annoté de MS-COCO enrichi de données non étiquetées, la performance s'améliore encore jusqu'à 47,7 mAP. Le code source est disponible à l'adresse suivante : \url{https://github.com/Adamdad/ConsistentTeacher}.