Ein einfaches semi-supervisedes Lernframework für Objektdetektion

Semi-supervised Learning (SSL) bietet das Potenzial, die Vorhersageleistung von maschinellen Lernmodellen durch die Nutzung von unbeschrifteten Daten zu verbessern. Obwohl in jüngster Zeit erhebliche Fortschritte erzielt wurden, beschränkte sich der Anwendungsbereich von SSL bisher hauptsächlich auf Aufgaben der Bildklassifikation. In diesem Paper stellen wir STAC vor – einen einfachen, aber wirksamen SSL-Framework für die visuelle Objektdetektion, ergänzt durch eine Strategie zur Datenaugmentation. STAC nutzt hochzuverlässige Pseudolabels lokalisierte Objekte aus unbeschrifteten Bildern und aktualisiert das Modell durch Durchsetzung von Konsistenz mittels starker Augmentierungen. Wir präsentieren experimentelle Protokolle zur Bewertung der Leistung von semi-supervised Objektdetektion anhand von MS-COCO und zeigen die Wirksamkeit von STAC sowohl auf MS-COCO als auch auf VOC07. Auf VOC07 verbessert STAC die AP$^{0.5}$ von 76,30 auf 79,08; auf MS-COCO erreicht STAC eine um das Zweifache höhere Dateneffizienz, indem es mit nur 5 % beschrifteten Daten eine mAP von 24,38 erzielt – gegenüber einem überwachten Baseline, der mit 10 % beschrifteten Daten lediglich 23,86 % mAP erreicht. Der Quellcode ist unter https://github.com/google-research/ssl_detection/ verfügbar.