Command Palette
Search for a command to run...
SCAN: Lernen, Bilder ohne Labels zu klassifizieren
SCAN: Lernen, Bilder ohne Labels zu klassifizieren
Wouter Van Gansbeke Simon Vandenhende Stamatis Georgoulis Marc Proesmans Luc Van Gool
Zusammenfassung
Können wir Bilder automatisch in semantisch sinnvolle Cluster gruppieren, wenn keine Ground-Truth-Annotierungen vorliegen? Die Aufgabe der unüberwachten Bildklassifizierung bleibt eine wichtige und offene Herausforderung im Bereich der Computer Vision. Mehrere kürzlich vorgeschlagene Ansätze haben versucht, dieses Problem in einem end-to-end-Prozess zu lösen. In diesem Artikel weichen wir von den jüngsten Arbeiten ab und plädieren für einen zweistufigen Ansatz, bei dem das Feature-Lernen und das Clustern getrennt werden. Zunächst wird eine selbstüberwachte Aufgabe aus dem Bereich des Repräsentationslernens verwendet, um semantisch sinnvolle Features zu extrahieren. Anschließend verwenden wir die erhaltenen Features als Prior in einem lernfähigen Clustering-Verfahren. Dadurch entfällt die Abhängigkeit des Clusterns von niedrigstufigen Features, die bei aktuellen end-to-end-Lernverfahren vorhanden ist. Experimentelle Auswertungen zeigen, dass wir die Stand-of-the-Art-Methoden um erhebliche Margen übertreffen, insbesondere um +26,6 % auf CIFAR10, +25,0 % auf CIFAR100-20 und +21,3 % auf STL10 hinsichtlich der Klassifikationsgenauigkeit. Darüber hinaus ist unsere Methode die erste, die bei einer großen Datenmenge für Bildklassifizierung gute Ergebnisse erzielt. Insbesondere erhalten wir vielversprechende Ergebnisse auf ImageNet und übertreffen mehrere semi-überwachte Lernmethoden im Low-Data-Bereich ohne die Verwendung irgendwelcher Ground-Truth-Annotierungen. Der Code ist öffentlich verfügbar unter https://github.com/wvangansbeke/Unsupervised-Classification.