HyperAIHyperAI
il y a 13 jours

Amélioration des performances du clustering k-Means grâce à des représentations internes désentrelacées

Abien Fred Agarap, Arnulfo P. Azcarraga
Amélioration des performances du clustering k-Means grâce à des représentations internes désentrelacées
Résumé

Les algorithmes de clustering profond combinent l’apprentissage de représentations et le clustering en optimisant simultanément une perte de clustering et une perte non liée au clustering. Dans ces méthodes, un réseau neuronal profond est utilisé pour l’apprentissage de représentations, en conjonction avec un réseau de clustering. Au lieu de suivre ce cadre afin d’améliorer les performances de clustering, nous proposons une approche plus simple fondée sur l’optimisation de l’entrelacement de la représentation latente apprise par un autoencodeur. Nous définissons l’entrelacement comme la proximité relative entre les paires de points appartenant à la même classe ou structure, par rapport aux paires de points provenant de classes ou structures différentes. Pour mesurer l’entrelacement des points de données, nous utilisons la perte de plus proche voisin souple, que nous étendons en introduisant un facteur de température d’annealing. Grâce à notre approche proposée, nous obtenons une précision de clustering de test de 96,2 % sur le jeu de données MNIST, de 85,6 % sur Fashion-MNIST, et de 79,2 % sur EMNIST Balanced, surpassant ainsi nos modèles de référence.