Sparse Semi-DETR: Sparse learnbare Queries für semi-supervised Object Detection

In diesem Artikel behandeln wir die Einschränkungen des auf DETR basierenden semi-supervised Object Detection (SSOD)-Frameworks, wobei wir uns insbesondere mit den Herausforderungen beschäftigen, die sich aus der Qualität der Objekt-Queries ergeben. Bei DETR-basierten SSOD-Verfahren führt die one-to-one-Zuweisungsstrategie zu ungenauen Pseudolabels, während die one-to-many-Zuweisungsstrategie zu überlappenden Vorhersagen führt. Diese Probleme beeinträchtigen die Trainingseffizienz und verschlechtern die Modellleistung, insbesondere bei der Erkennung kleiner oder teilweise verdeckter Objekte. Wir stellen Sparse Semi-DETR vor, eine neuartige, transformerbasierte, end-to-end semi-supervised Object Detection-Lösung, die diese Herausforderungen überwindet. Sparse Semi-DETR integriert ein Query Refinement Module, um die Qualität der Objekt-Queries zu verbessern, wodurch die Erkennungsfähigkeit für kleine und teilweise verdeckte Objekte erheblich gesteigert wird. Zudem implementieren wir ein Reliable Pseudo-Label Filtering Module, das hochwertige Pseudolabels selektiv filtert und somit die Detektionsgenauigkeit und Konsistenz verbessert. Auf den MS-COCO- und Pascal VOC-Objekterkennungsbenchmarks erreicht Sparse Semi-DETR eine signifikante Verbesserung gegenüber aktuellen state-of-the-art-Methoden, was die Wirksamkeit von Sparse Semi-DETR im semi-supervised Object Detection – insbesondere in anspruchsvollen Szenarien mit kleinen oder teilweise verdeckten Objekten – unterstreicht.