Neubewertung der Klassenungleichgewichtsproblematik für end-to-end semi-supervised Object Detection

Semi-supervised Object Detection (SSOD) hat mit der Entwicklung von pseudo-Label-basierten end-to-end-Methoden erhebliche Fortschritte gemacht. Dennoch stoßen viele dieser Ansätze auf Herausforderungen aufgrund von Klassenungleichgewicht, das die Effektivität des Pseudo-Label-Generators beeinträchtigt. Zudem zeigt die Literatur, dass schlechte Pseudo-Labels die Leistungsfähigkeit von SSOD erheblich einschränken. In diesem Paper untersuchen wir die Ursachen für die geringe Qualität von Pseudo-Labels und präsentieren neuartige Lernmechanismen zur Verbesserung der Labelgenerierung. Um hohe Falsch-Negativ-Raten und geringe Genauigkeit zu bewältigen, führen wir eine adaptive Schwellenwert-Regelung ein, die dem vorgeschlagenen Netzwerk hilft, optimale Bounding Boxes zu filtern. Darüber hinaus stellen wir ein Jitter-Bagging-Modul vor, das präzise Informationen zur Lokalisierung bereitstellt, um die Bounding Boxes zu verfeinern. Zudem werden zwei neue Verlustfunktionen eingeführt, die die Hintergrund- und Vordergrund-Scores nutzen, die von Lehr- und Schüler-Netzwerken vorhergesagt werden, um die Recall-Rate der Pseudo-Labels zu verbessern. Außerdem wenden wir eine strenge Supervision auf das Lehr-Netzwerk an, indem wir stark und schwach augmentierte Daten verwenden, um robuste Pseudo-Labels zu generieren, sodass es auch kleine und komplexe Objekte erkennen kann. Schließlich zeigen umfangreiche Experimente, dass das vorgeschlagene Netzwerk auf den MS-COCO- und Pascal VOC-Datensätzen state-of-the-art-Methoden übertrifft und es dem Baseline-Netzwerk ermöglicht, mit nur 20 % beschrifteter Daten eine 100 %ige Leistung im überwachten Szenario zu erreichen.