il y a 2 mois

Discrimination de Clusters Stables pour le Clustering Profond

Qi Qian

Résumé

Le clustering profond peut optimiser les représentations des instances (c'est-à-dire l'apprentissage de représentation) et explorer la distribution intrinsèque des données (c'est-à-dire le clustering) simultanément, ce qui démontre une performance supérieure aux méthodes de clustering conventionnelles utilisant des caractéristiques prédéfinies. Cependant, l'objectif couplé implique une solution triviale où toutes les instances s'effondrent vers des caractéristiques uniformes. Pour relever ce défi, une stratégie d'entraînement en deux étapes a été développée pour découpler ces objectifs : elle introduit une étape préliminaire d'entraînement pour l'apprentissage de représentation, puis affine le modèle obtenu pour le clustering. Parallèlement, des méthodes en une seule étape ont principalement été développées pour l'apprentissage de représentation plutôt que pour le clustering, où diverses contraintes d'affectation de clusters sont conçues pour éviter explicitement l'effondrement. Malgré le succès de ces méthodes, un objectif d'apprentissage approprié spécifiquement adapté au clustering profond n'a pas encore été suffisamment étudié.Dans cette étude, nous montrons d'abord que la tâche discriminante courante dans l'apprentissage supervisé est instable pour le clustering en une seule étape en raison du manque d'étiquettes véritables et d'instances positives pour certains clusters dans chaque mini-lot. Pour atténuer ce problème, une nouvelle tâche de discrimination de cluster stable (SeCu) est proposée, ainsi qu'un nouveau critère de clustering prenant en compte la difficulté qui peut être dérivé en conséquence. De plus, une contrainte globale d'entropie pour les affectations de clusters est étudiée avec une optimisation efficace. Des expériences approfondies sont menées sur des jeux de données de référence et ImageNet. SeCu atteint des performances à l'état de l'art sur tous ces jeux de données, ce qui démontre l'efficacité du clustering profond en une seule étape. Le code source est disponible à l'adresse \url{https://github.com/idstcv/SeCu}.