SimMatch: Semi-supervised Learning mit Similarity Matching

Das Lernen mit wenigen gelabelten Daten stellt ein langjähriges Problem in der Forschungsgemeinschaft für Computer Vision und maschinelles Lernen dar. In diesem Paper stellen wir einen neuen semi-supervised Learning-Framework namens SimMatch vor, der sowohl semantische als auch instanzbasierte Ähnlichkeit gleichzeitig berücksichtigt. In SimMatch wird die Konsistenzregularisierung sowohl auf semantischer als auch auf instanzbasierter Ebene angewendet. Verschiedene augmentierte Ansichten derselben Instanz werden ermutigt, dieselbe Klassenvorhersage zu liefern und ähnliche Ähnlichkeitsbeziehungen zu anderen Instanzen aufzubewahren. Anschließend instanziieren wir einen gelabelten Speicherpuffer, um die zugrundeliegenden Wahrheitslabels auf instanzbasierter Ebene optimal auszunutzen und die Lücke zwischen semantischer und instanzbasierter Ähnlichkeit zu schließen. Schließlich führen wir die Operationen Unfolding und Aggregation ein, die es ermöglichen, diese beiden Ähnlichkeitskonzepte isomorph ineinander zu transformieren. Auf diese Weise können semantische und instanzbasierte Pseudolabels wechselseitig propagiert werden, um qualitativ hochwertigere und zuverlässigere Matching-Ziele zu generieren. Ausführliche experimentelle Ergebnisse zeigen, dass SimMatch die Leistung semi-supervised Learning-Aufgaben auf verschiedenen Benchmark-Datensätzen und unterschiedlichen Einstellungen verbessert. Insbesondere erreicht SimMatch bei einer Trainingsdauer von 400 Epochen eine Top-1-Accuracy von 67,2 % und 74,4 % auf ImageNet mit jeweils 1 % und 10 % gelabelten Beispielen, was die Baseline-Methoden erheblich übertrifft und sogar frühere semi-supervised Learning-Frameworks übertrifft. Der Quellcode und vortrainierte Modelle sind unter https://github.com/KyleZheng1997/simmatch verfügbar.