HyperAIHyperAI
vor 2 Monaten

Invariantes Informationsclustering für die unüberwachte Bildklassifizierung und -segmentierung

Xu Ji; João F. Henriques; Andrea Vedaldi
Invariantes Informationsclustering für die unüberwachte Bildklassifizierung und -segmentierung
Abstract

Wir präsentieren ein neues Clustering-Ziel, das ein neuronales Netzwerk-Klassifikator aus dem Grundmodell lernt, ausschließlich mit nicht gekennzeichneten Datenproben. Das Modell entdeckt Cluster, die den semantischen Klassen genau entsprechen und erzielt Spitzenwerte in acht Benchmarks für unüberwachtes Clustering, die sich auf Bildklassifizierung und -segmentierung erstrecken. Dazu gehören STL10, eine unüberwachte Variante von ImageNet, und CIFAR10, bei denen wir die Genauigkeit unserer nächsten Konkurrenten um 6,6 und 9,5 absolute Prozentpunkte deutlich übertrumpfen. Die Methode ist nicht spezialisiert auf Computer Vision und arbeitet mit beliebigen gepaarten Datensatzproben; in unseren Experimenten verwenden wir zufällige Transformationen, um aus jedem Bild ein Paar zu erhalten. Das trainierte Netzwerk gibt direkt semantische Labels aus, anstatt hochdimensionale Darstellungen, die eine externe Verarbeitung benötigen, um für das semantische Clustering nutzbar zu sein. Das Ziel besteht einfach darin, die gegenseitige Information zwischen den Klassenzuordnungen jedes Paares zu maximieren. Es ist leicht zu implementieren und streng auf der Informations-Theorie basierend, was bedeutet, dass wir degenerierte Lösungen mühelos vermeiden können, denen andere Clusterverfahren anfällig sind. Neben dem vollständig unüberwachten Modus testen wir auch zwei semi-überwachte Szenarien. Das erste erreicht eine Genauigkeit von 88,8 % bei der Klassifizierung von STL10 und setzt einen neuen globalen Stand der Technik für alle existierenden Methoden (ob überwacht, semi-überwacht oder unüberwacht). Das zweite zeigt Robustheit gegenüber einer Reduktion des Label-Umfangs um 90 %, was für Anwendungen relevant ist, die kleine Mengen von Labels nutzen möchten. github.com/xu-ji/IIC

Invariantes Informationsclustering für die unüberwachte Bildklassifizierung und -segmentierung | Neueste Forschungsarbeiten | HyperAI