HyperAIHyperAI
vor 2 Monaten

N2D: (Nicht zu) Tiefes Clustering durch Clustering der lokalen Mannigfaltigkeit einer Autoencoded Einbettung

Ryan McConville; Raul Santos-Rodriguez; Robert J Piechocki; Ian Craddock
N2D: (Nicht zu) Tiefes Clustering durch Clustering der lokalen Mannigfaltigkeit einer Autoencoded Einbettung
Abstract

Tiefes Clustering hat zunehmend seine Überlegenheit gegenüber konventionellen flachen Clusterverfahren unter Beweis gestellt. Tiefclusteralgorithmen kombinieren in der Regel Darstellungslernen mit tiefen neuronalen Netzen, um diese Leistung zu erzielen, wobei typischerweise ein Clustering- und ein nicht-Clustering-Verlust optimiert wird. In solchen Fällen ist ein Autoencoder in der Regel mit einem Clusternetzwerk verbunden, und die endgültige Clusterung wird von beiden, dem Autoencoder und dem Clusternetzwerk, gemeinsam gelernt. Stattdessen schlagen wir vor, eine autoencoded Einbettung zu lernen und dann weiter nach der zugrunde liegenden Mannigfaltigkeit zu suchen. Aus Gründen der Einfachheit clustern wir diese anschließend mit einem flachen Clusterverfahren anstelle eines tieferen Netzwerks. Wir untersuchen eine Reihe von lokalen und globalen Mannigfaltigkeitslernalgorithmen sowohl auf den Rohdaten als auch auf der autoencoded Einbettung und kommen zu dem Schluss, dass UMAP in unserem Framework am besten in der Lage ist, die clusterfähigste Mannigfaltigkeit in der Einbettung zu finden. Dies deutet darauf hin, dass lokale Mannigfaltigkeitslernen auf einer autoencoded Einbettung effektiv für die Entdeckung höherwertiger Cluster ist. Wir zeigen quantitativ anhand verschiedener Bild- und Zeitreihendatensätze, dass unsere Methode wettbewerbsfähige Ergebnisse gegenüber den neuesten tiefen Clusteralgorithmen erzielt, einschließlich der Überlegenheit gegenüber dem aktuellen Stand der Technik bei mehreren Datensätzen. Wir vermuten, dass diese Ergebnisse eine vielversprechende Forschungsrichtung für tiefes Clustering aufzeigen. Der Code kann unter https://github.com/rymc/n2d abgerufen werden.