HyperAIHyperAI
il y a 2 mois

Apprentissage Contrastif Jumeau pour le Clustering en Ligne

Li, Yunfan ; Yang, Mouxing ; Peng, Dezhong ; Li, Taihao ; Huang, Jiantao ; Peng, Xi
Apprentissage Contrastif Jumeau pour le Clustering en Ligne
Résumé

Ce papier propose de réaliser un clustering en ligne en effectuant un apprentissage contrastif jumeau (TCL) au niveau des instances et des clusters. Plus précisément, nous avons constaté que lorsque les données sont projetées dans un espace de caractéristiques dont la dimensionnalité correspond au nombre cible de clusters, les lignes et les colonnes de sa matrice de caractéristiques correspondent respectivement à la représentation des instances et des clusters. Sur la base de cette observation, pour un ensemble de données donné, le TCL proposé construit d'abord des paires positives et négatives grâce à des augmentations de données. Ensuite, dans l'espace des lignes et des colonnes de la matrice de caractéristiques, l'apprentissage contrastif est respectivement effectué au niveau des instances et des clusters en rapprochant les paires positives tout en éloignant les négatives. Pour atténuer l'influence des paires négatives intrinsèques et corriger les affectations de clusters, nous adoptons un critère basé sur la confiance pour sélectionner des pseudo-étiquettes afin d'améliorer à la fois l'apprentissage contrastif au niveau des instances et celui au niveau des clusters. Par conséquent, les performances du clustering sont encore améliorées. Outre l'idée élégante de l'apprentissage contrastif jumeau, un autre avantage du TCL est qu'il peut prédire indépendamment l'affectation de cluster pour chaque instance, ce qui permet une adaptation facile aux scénarios en ligne. Des expériences approfondies sur six jeux de données largement utilisés pour les images et le texte démontrent l'efficacité du TCL. Le code sera publié sur GitHub.

Apprentissage Contrastif Jumeau pour le Clustering en Ligne | Articles de recherche récents | HyperAI