Apprentissage auto-orienté équilibré pour un réseau de regroupement adversaire génératif

Le clustering constitue un problème fondamental dans de nombreuses applications d’apprentissage automatique, mais reste un défi lorsqu’il s’agit de traiter des données réelles complexes. Les algorithmes de clustering existants reposent soit sur des modèles peu profonds aux capacités insuffisantes pour capturer la nature non linéaire des données, soit sur des modèles profonds comportant un grand nombre de paramètres, susceptibles de surajustement. Dans ce travail, nous proposons un réseau profond de clustering par génération adversaire (ClusterGAN), qui aborde de manière non supervisée les difficultés liées à l’entraînement des modèles de clustering profonds. ClusterGAN est composé de trois réseaux : un discriminateur, un générateur et un clusteriseur (c’est-à-dire un réseau de clustering). Nous mettons en œuvre un jeu adversarial entre ces trois entités afin de générer des échantillons réalistes à partir de variables latentes discriminantes via le générateur, tout en apprenant la transformation inverse des échantillons réels vers l’espace d’encodage discriminant via le clusteriseur. En outre, nous introduisons une fonction de perte basée sur la minimisation de l’entropie conditionnelle pour augmenter ou diminuer respectivement la similarité entre échantillons intra- et inter-cluster. Étant donné que les similarités vraies ne sont pas connues dans les tâches de clustering, nous proposons un nouvel algorithme d’apprentissage auto-équilibré progressif, qui intègre progressivement les échantillons à l’entraînement du plus facile au plus difficile, tout en tenant compte de la diversité des échantillons sélectionnés provenant de tous les clusters. Ainsi, notre méthode permet d’entraîner efficacement des clusteriseurs profonds grâce au jeu adversarial proposé et à l’algorithme d’apprentissage auto-équilibré progressif. Selon nos expériences, ClusterGAN atteint des résultats compétitifs par rapport aux modèles d’état de l’art en clustering et en hachage sur plusieurs jeux de données.