HyperAIHyperAI
vor 2 Monaten

Tiefe Clustering durch gemeinsame Faltungsautoencoder-Embedding und Minimierung der relativen Entropie

Kamran Ghasedi Dizaji; Amirhossein Herandi; Cheng Deng; Weidong Cai; Heng Huang
Tiefe Clustering durch gemeinsame Faltungsautoencoder-Embedding und Minimierung der relativen Entropie
Abstract

Bildclustering ist eine der wichtigsten Anwendungen im Bereich der Computer Vision, die in der Literatur intensiv untersucht wurde. Aktuelle Clusterverfahren leiden jedoch in der Regel an mangelnder Effizienz und Skalierbarkeit bei der Verarbeitung von großen und hochdimensionalen Datenmengen. In dieser Arbeit schlagen wir ein neues Clustervorhersagemodell vor, das als DEeP Embedded RegularIzed ClusTering (DEPICT) bezeichnet wird. DEPICT kartiert Daten effizient in einen diskriminativen Einbettungsunterraum und führt präzise Clusterzuordnungen vor. DEPICT besteht im Allgemeinen aus einer multinomialen logistischen Regressionsfunktion, die auf einem mehrschichtigen konvolutionellen Autoencoder aufgebaut ist. Wir definieren eine Clustierzieldfunktion durch die Minimierung der relativen Entropie (Kullback-Leibler-Divergenz), regularisiert durch eine A-priori-Verteilung für die Häufigkeit der Clusterzuordnungen. Daraufhin wird eine alternative Strategie abgeleitet, um das Ziel durch das Aktualisieren von Parametern und das Schätzen von Clusterzuordnungen zu optimieren. Des Weiteren verwenden wir Rekonstruktionsverlustfunktionen in unserem Autoencoder als datenabhängige Regularisierungsterme, um ein Überanpassen der tiefen Einbettungsfunktion zu verhindern. Um von einer end-to-end Optimierung zu profitieren und die Notwendigkeit einer schichtweisen Vortraining zu beseitigen, führen wir ein gemeinsames Lernframework ein, das die vereinten Clustertzield- und Rekonstruktionsverlustfunktionen simultan minimiert und alle Netzwerkschichten gleichzeitig trainiert. Experimentelle Ergebnisse zeigen die Überlegenheit und den kürzeren Laufzeit von DEPICT bei realweltlichen Clusteraufgaben, bei denen keine etikettierten Daten für die Feinabstimmung von Hyperparametern zur Verfügung stehen.