HyperAIHyperAI
il y a 11 jours

Clustering par contraste

Yunfan Li, Peng Hu, Zitao Liu, Dezhong Peng, Joey Tianyi Zhou, Xi Peng
Clustering par contraste
Résumé

Dans cet article, nous proposons une méthode de clustering en ligne à une étape appelée Contrasting Clustering (CC), qui réalise explicitement un apprentissage contrastif au niveau des instances et au niveau des clusters. Plus précisément, pour un ensemble de données donné, des paires d’instances positives et négatives sont construites à l’aide de transformations de données, puis projetées dans un espace de caractéristiques. Dans cet espace, l’apprentissage contrastif au niveau des instances est effectué dans l’espace des lignes, tandis que l’apprentissage contrastif au niveau des clusters est réalisé dans l’espace des colonnes, en maximisant les similarités des paires positives tout en minimisant celles des paires négatives. Notre observation clé est que les lignes de la matrice de caractéristiques peuvent être interprétées comme des étiquettes douces des instances, et que les colonnes peuvent ainsi être considérées comme des représentations des clusters. En optimisant simultanément les pertes contrastives au niveau des instances et au niveau des clusters, le modèle apprend de manière end-to-end à la fois les représentations et les affectations de clusters. Les résultats expérimentaux étendus montrent que CC surpasse significativement 17 méthodes concurrentes de clustering sur six benchmarks d’images exigeants. En particulier, CC atteint un score NMI de 0,705 (0,431) sur le jeu de données CIFAR-10 (CIFAR-100), soit une amélioration de performance allant jusqu’à 19 % (39 %) par rapport à la meilleure méthode de référence.

Clustering par contraste | Articles de recherche récents | HyperAI