Embagement Profond Non Supervisé pour l'Analyse de Clustering

Le regroupement est central dans de nombreux domaines d'applications guidées par les données et a été largement étudié en termes de fonctions de distance et d'algorithmes de groupement. Cependant, relativement peu de travaux se sont concentrés sur l'apprentissage de représentations pour le regroupement. Dans cet article, nous proposons le Regroupement Embarqué Profond (Deep Embedded Clustering - DEC), une méthode qui apprend simultanément des représentations de caractéristiques et des affectations de clusters à l'aide de réseaux neuronaux profonds. DEC apprend une carte du domaine des données vers un espace de caractéristiques de dimension inférieure, dans lequel il optimise itérativement un objectif de regroupement. Nos évaluations expérimentales sur des corpus d'images et de textes montrent une amélioration significative par rapport aux méthodes les plus avancées actuellement disponibles.