HyperAIHyperAI
vor 11 Tagen

Instant-Teaching: Ein end-to-end semi-supervisedes Objektdetektionsframework

Qiang Zhou, Chaohui Yu, Zhibin Wang, Qi Qian, Hao Li
Instant-Teaching: Ein end-to-end semi-supervisedes Objektdetektionsframework
Abstract

Überwachte Lernansätze für Objekterkennung erfordern eine große Menge an aufwändigen manuellen Annotationen, was in realen Anwendungen oft nicht praktikabel ist. Semi-supervised Object Detection (SSOD) kann unlabeled Daten effektiv nutzen, um die Modellleistung zu verbessern, was von großer Bedeutung für die praktische Anwendung von Objekterkennungsmodellen ist. In diesem Artikel überprüfen wir erneut den Ansatz von SSOD und stellen Instant-Teaching vor – einen vollständig end-to-end und effektiven SSOD-Framework, der in jeder Trainingsiteration sogenannte „instant pseudo labeling“-Techniken in Kombination mit erweiterten, schwach-starken Datenaugmentierungen zur Modellverbesserung nutzt. Um das Problem der Bestätigungsverzerrung (confirmation bias) zu mildern und die Qualität der Pseudolabels zu erhöhen, führen wir zudem einen ko-rectify-Plan basierend auf Instant-Teaching ein, bezeichnet als Instant-Teaching$^*$. Umfangreiche Experimente auf den Datensätzen MS-COCO und PASCAL VOC belegen die Überlegenheit unseres Ansatzes. Insbesondere erreicht unsere Methode bei Verwendung nur von 2 % gelabelter Daten auf MS-COCO die bisher besten Methoden um 4,2 mAP übertreffen. Selbst bei vollständiger Verwendung der gelabelten Informationen von MS-COCO übertrifft unsere Methode die aktuellen State-of-the-Art-Methoden um etwa 1,0 mAP. Auf PASCAL VOC erzielen wir durch die Verwendung von VOC07 als gelabelte Daten und VOC12 als unlabeled Daten eine Verbesserung von mehr als 5 mAP.

Instant-Teaching: Ein end-to-end semi-supervisedes Objektdetektionsframework | Neueste Forschungsarbeiten | HyperAI