Sparse Semi-DETR : requêtes apprenables éparses pour la détection d'objets semi-supervisée

Dans cet article, nous abordons les limitations du cadre de détection d'objets semi-supervisée basé sur DETR, en mettant particulièrement l'accent sur les défis posés par la qualité des requêtes d'objets. Dans les méthodes de détection semi-supervisée basées sur DETR, la stratégie d’attribution un à un génère des pseudo-étiquettes inexactes, tandis que la stratégie d’attribution un à plusieurs entraîne des prédictions chevauchantes. Ces problèmes compromettent l'efficacité de l'entraînement et dégradent les performances du modèle, en particulier dans la détection d'objets petits ou partiellement masqués. Nous proposons Sparse Semi-DETR, une nouvelle solution de détection d'objets semi-supervisée, entièrement end-to-end, basée sur un transformateur, conçue pour surmonter ces défis. Sparse Semi-DETR intègre un module de raffinement des requêtes (Query Refinement Module) afin d'améliorer significativement la qualité des requêtes d'objets, ce qui renforce considérablement la capacité de détection des objets petits ou partiellement obscurcis. En outre, nous intégrons un module de filtrage des pseudo-étiquettes fiables (Reliable Pseudo-Label Filtering Module), qui sélectionne de manière sélective les pseudo-étiquettes de haute qualité, améliorant ainsi la précision et la cohérence de la détection. Sur les benchmarks de détection d'objets MS-COCO et Pascal VOC, Sparse Semi-DETR atteint des performances nettement supérieures aux méthodes de l’état de l’art actuelles, démontrant ainsi l’efficacité de notre approche dans les scénarios de détection semi-supervisée, notamment dans des conditions difficiles impliquant des objets petits ou partiellement masqués.