HyperAIHyperAI
il y a 2 mois

N2D : (Pas Trop) Profond Clustering via le Clustering de la Variété Locale d'un Embedding Autoencodé

Ryan McConville; Raul Santos-Rodriguez; Robert J Piechocki; Ian Craddock
N2D : (Pas Trop) Profond Clustering via le Clustering de la Variété Locale d'un Embedding Autoencodé
Résumé

Le clustering profond démontre de plus en plus son supériorité par rapport aux algorithmes de clustering superficiel conventionnels. Les algorithmes de clustering profond combinent généralement l'apprentissage de représentation avec des réseaux neuronaux profonds pour atteindre cette performance, en optimisant typiquement une perte de clustering et une perte non de clustering. Dans ces cas, un autoencodeur est généralement connecté à un réseau de clustering, et le clustering final est appris conjointement par l'autoencodeur et le réseau de clustering. À la place, nous proposons d'apprendre une représentation autoencodée puis de rechercher davantage la variété sous-jacente dans cette représentation. Pour simplifier, nous utilisons ensuite un algorithme de clustering superficiel plutôt qu'un réseau plus profond pour effectuer le clustering. Nous étudions plusieurs méthodes d'apprentissage local et global de variétés sur les données brutes et l'embedding autoencodé, concluant que UMAP dans notre cadre est le mieux capable de trouver la variété la plus clusterable dans l'embedding, ce qui suggère que l'apprentissage local de variétés sur un embedding autoencodé est efficace pour découvrir des clusters de meilleure qualité. Nous montrons quantitativement, sur une gamme de jeux de données d'images et séries temporelles, que notre méthode offre des performances compétitives face aux derniers algorithmes de clustering profond, y compris en surpassant l'état actuel de l'art sur plusieurs d'entre eux. Nous postulons que ces résultats indiquent une direction prometteuse pour la recherche en clustering profond. Le code peut être trouvé à l'adresse suivante : https://github.com/rymc/n2d

N2D : (Pas Trop) Profond Clustering via le Clustering de la Variété Locale d'un Embedding Autoencodé | Articles de recherche récents | HyperAI