HyperAIHyperAI
vor 11 Tagen

MUM: Mix Image Tiles und UnMix Feature Tiles für semi-supervised Object Detection

JongMok Kim, Jooyoung Jang, Seunghyeon Seo, Jisoo Jeong, Jongkeun Na, Nojun Kwak
MUM: Mix Image Tiles und UnMix Feature Tiles für semi-supervised Object Detection
Abstract

Viele aktuelle Studien im Bereich des halbüberwachten Lernens (Semi-Supervised Learning, SSL) basieren auf einer Lehrer-Schüler-Architektur und trainieren das Schüler-Netzwerk mittels eines aus dem Lehrer generierten überwachenden Signals. Die Datenaugmentation spielt dabei eine entscheidende Rolle im SSL-Framework, da es schwierig ist, ein schwaches-starkes Augmentierungs-Paar zu erzeugen, ohne Informationen über die Etikettierung zu verlieren. Insbesondere bei der Erweiterung von SSL auf das halbüberwachte Objektdetektions-Problem (Semi-Supervised Object Detection, SSOD) sind viele starke Augmentierungsstrategien, die auf Bildgeometrie und Interpolations-Regularisierung basieren, schwer nutzbar, da sie die räumliche Position der Bounding Boxes in der Objektdetektion beeinträchtigen können. Um dieses Problem zu lösen, stellen wir eine einfache, aber effektive Datenaugmentierungsmethode namens Mix/UnMix (MUM) vor, die zur SSOD-Architektur passt und die Feature-Teile gemischter Bildteile wiederherstellt. Unser vorgeschlagenes Verfahren verarbeitet gemischte Bildteile und rekonstruiert sie im Merkmalsraum. Dadurch kann MUM den Effekt der Interpolations-Regularisierung aus nicht-interpolierten Pseudolabels nutzen und erfolgreich ein sinnvolles schwaches-starkes Paar erzeugen. Zudem lässt sich MUM problemlos auf verschiedene SSOD-Methoden aufsetzen. Ausführliche Experimente auf den Datensätzen MS-COCO und PASCAL VOC zeigen die Überlegenheit von MUM, da sie die mAP-Leistung in allen getesteten SSOD-Benchmark-Protokollen konsistent gegenüber der Basislinie verbessert.

MUM: Mix Image Tiles und UnMix Feature Tiles für semi-supervised Object Detection | Neueste Forschungsarbeiten | HyperAI