HyperAIHyperAI
vor 11 Tagen

Kontrastives Clustering

Yunfan Li, Peng Hu, Zitao Liu, Dezhong Peng, Joey Tianyi Zhou, Xi Peng
Kontrastives Clustering
Abstract

In diesem Artikel stellen wir eine einstufige Online-Clustering-Methode namens Contrastive Clustering (CC) vor, die explizit sowohl instanz- als auch cluster-orientierte kontrastive Lernverfahren durchführt. Genauer gesagt werden für eine gegebene Datensatz positive und negative Instanzpaare durch Datenverstärkung (data augmentation) erzeugt und anschließend in einen Merkmalsraum projiziert. In diesem Raum werden das instanz- und das cluster-orientierte kontrastive Lernen jeweils im Zeilen- und Spaltenraum des Merkmalsmatrix durchgeführt, indem die Ähnlichkeiten zwischen positiven Paaren maximiert und die zwischen negativen Paaren minimiert werden. Unser zentrales Beobachtung ist, dass die Zeilen der Merkmalsmatrix als weiche Labels der Instanzen interpretiert werden können, wodurch die Spalten als weitere Darstellungen der Cluster angesehen werden können. Durch die gleichzeitige Optimierung der instanz- und cluster-orientierten kontrastiven Verlustfunktion lernt das Modell in end-to-end-Weise sowohl Merkmale als auch Clusterzuordnungen gemeinsam. Umfangreiche experimentelle Ergebnisse zeigen, dass CC gegenüber 17 konkurrierenden Clustering-Methoden auf sechs anspruchsvollen Bildbenchmark-Datensätzen erheblich übertrifft. Insbesondere erreicht CC auf dem CIFAR-10-Datensatz eine NMI von 0,705 (0,431 auf CIFAR-100), was einer Leistungssteigerung von bis zu 19 % (39 %) gegenüber der besten Baseline entspricht.