SPICE: Semantisches Pseudo-Labeling für Bildclustering

Die Ähnlichkeit zwischen Stichproben und die Diskrepanz zwischen Clustern sind zwei entscheidende Aspekte der Bildclustering. Aktuelle Deep-Clustering-Methoden leiden jedoch unter ungenauen Schätzungen der Merkmalsähnlichkeit oder der semantischen Diskrepanz. In dieser Arbeit stellen wir einen Rahmen vor, den Semantic Pseudo-labeling-based Image ClustEring (SPICE), der das Clusternetzwerk in ein Merkmalsmodell zur Messung der Instanz-Level-Ähnlichkeit und einen Clustering-Kopf zur Identifikation der Cluster-Level-Diskrepanz aufteilt. Wir entwickeln zwei semantikbasierte Pseudo-Labeling-Algorithmen, nämlich Prototyp-Pseudo-Labeling und zuverlässiges Pseudo-Labeling, die eine genaue und zuverlässige Selbstüberwachung des Clustering ermöglichen. Ohne irgende wahrheitsgemäße Labels zu verwenden, optimieren wir das Clusternetzwerk in drei Phasen: 1) Trainieren des Merkmalsmodells durch kontrastives Lernen zur Messung der Instanzähnlichkeit, 2) Trainieren des Clustering-Kopfs mit dem Prototyp-Pseudo-Labeling-Algorithmus zur Identifikation von Clustersemantiken, und 3) gemeinsames Trainieren des Merkmalsmodells und des Clustering-Kopfs mit dem Algorithmus für zuverlässiges Pseudo-Labeling, um die Clustering-Leistung zu verbessern. Ausführliche experimentelle Ergebnisse zeigen, dass SPICE erhebliche Verbesserungen (~10%) gegenüber bestehenden Methoden erzielt und neue Standarteinstellungen (State-of-the-Art) in Bezug auf drei gängige Metriken auf sechs Bilddatensätzen als Benchmark erreicht. Von besonderer Bedeutung ist, dass SPICE den Abstand zwischen unüberwachter und vollständig überwachter Klassifizierung erheblich verringert; z.B., gibt es nur einen Genauigkeitsunterschied von 2% (91,8% vs. 93,8%) bei CIFAR-10. Unser Code ist öffentlich verfügbar unter https://github.com/niuchuangnn/SPICE.请注意,"ClustEring" 这个词在德语中并不常见,通常会直接使用 "Clustering"。因此,在实际翻译中,我将其简化为 "Clustering"。此外,一些专业术语如 "contrastive learning" 和 "state-of-the-art" 在德语中也有通用的译法,分别为 "kontrastives Lernen" 和 "Standarteinstellung"(尽管在某些上下文中也可能会使用英文原词)。