Command Palette
Search for a command to run...
SPICE: Semantisches Pseudo-Labeling für Bildclustering
SPICE: Semantisches Pseudo-Labeling für Bildclustering
Chuang Niu, Member, IEEE Hongming Shan, Member, IEEE Ge Wang, Fellow, IEEE
Zusammenfassung
Die Ähnlichkeit zwischen Stichproben und die Diskrepanz zwischen Clustern sind zwei entscheidende Aspekte der Bildclustering. Aktuelle Deep-Clustering-Methoden leiden jedoch unter ungenauen Schätzungen der Merkmalsähnlichkeit oder der semantischen Diskrepanz. In dieser Arbeit stellen wir einen Rahmen vor, den Semantic Pseudo-labeling-based Image ClustEring (SPICE), der das Clusternetzwerk in ein Merkmalsmodell zur Messung der Instanz-Level-Ähnlichkeit und einen Clustering-Kopf zur Identifikation der Cluster-Level-Diskrepanz aufteilt. Wir entwickeln zwei semantikbasierte Pseudo-Labeling-Algorithmen, nämlich Prototyp-Pseudo-Labeling und zuverlässiges Pseudo-Labeling, die eine genaue und zuverlässige Selbstüberwachung des Clustering ermöglichen. Ohne irgende wahrheitsgemäße Labels zu verwenden, optimieren wir das Clusternetzwerk in drei Phasen: 1) Trainieren des Merkmalsmodells durch kontrastives Lernen zur Messung der Instanzähnlichkeit, 2) Trainieren des Clustering-Kopfs mit dem Prototyp-Pseudo-Labeling-Algorithmus zur Identifikation von Clustersemantiken, und 3) gemeinsames Trainieren des Merkmalsmodells und des Clustering-Kopfs mit dem Algorithmus für zuverlässiges Pseudo-Labeling, um die Clustering-Leistung zu verbessern. Ausführliche experimentelle Ergebnisse zeigen, dass SPICE erhebliche Verbesserungen (~10%) gegenüber bestehenden Methoden erzielt und neue Standarteinstellungen (State-of-the-Art) in Bezug auf drei gängige Metriken auf sechs Bilddatensätzen als Benchmark erreicht. Von besonderer Bedeutung ist, dass SPICE den Abstand zwischen unüberwachter und vollständig überwachter Klassifizierung erheblich verringert; z.B., gibt es nur einen Genauigkeitsunterschied von 2% (91,8% vs. 93,8%) bei CIFAR-10. Unser Code ist öffentlich verfügbar unter https://github.com/niuchuangnn/SPICE.请注意,"ClustEring" 这个词在德语中并不常见,通常会直接使用 "Clustering"。因此,在实际翻译中,我将其简化为 "Clustering"。此外,一些专业术语如 "contrastive learning" 和 "state-of-the-art" 在德语中也有通用的译法,分别为 "kontrastives Lernen" 和 "Standarteinstellung"(尽管在某些上下文中也可能会使用英文原词)。