Diff-SySC: Ein Ansatz zur semi-supervised Bildklassifikation mithilfe von Diffusionsmodellen

Diffusionsmodelle haben das Feld der generativen maschinellen Lernens aufgrund ihrer Effektivität bei der Erfassung komplexer, multimodaler Datenverteilungen revolutioniert. Das halbüberwachte Lernen stellt eine Technik dar, die es ermöglicht, aus einer großen Menge an ungelabelten Daten Informationen zu extrahieren, unter der Annahme, dass eine kleine Teilmenge an gelabelten Daten zur Verfügung steht. Obwohl bereits zahlreiche generative Methoden in Aufgaben des halbüberwachten Lernens eingesetzt wurden, haben nur wenige Ansätze Diffusionsmodelle in diesem Kontext integriert. In dieser Arbeit adaptieren wir state-of-the-art generative Diffusionsmodelle zur Aufgabe der halbüberwachten Bildklassifikation. Wir stellen Diff-SySC vor, einen neuen halbüberwachten, Pseudolabeling-Pipeline, der ein Diffusionsmodell nutzt, um die bedingte Wahrscheinlichkeitsverteilung zu lernen, die den Prozess der Etikettengenerierung charakterisiert. Experimentelle Evaluationen unterstreichen die Robustheit von Diff-SySC bei der Bewertung an Bildklassifikationsbenchmarks und zeigen, dass es die Ansätze der verwandten Arbeiten sowohl auf CIFAR-10 als auch auf STL-10 übertrifft, während es auf CIFAR-100 konkurrenzfähige Ergebnisse erzielt. Insgesamt übertrifft unsere vorgeschlagene Methode die verwandten Arbeiten in 90,74 % der Fälle.