vor 2 Monaten
Unüberwachtes Tiefes Einbetten für Clustermanalysis
Junyuan Xie; Ross Girshick; Ali Farhadi

Abstract
Clustering ist ein zentrales Thema in vielen datengetriebenen Anwendungsbereichen und wurde bereits umfassend im Hinblick auf Distanzfunktionen und Gruppierungsverfahren untersucht. Relativ wenig Forschung hat sich jedoch auf das Lernen von Repräsentationen für Clustering konzentriert. In dieser Arbeit schlagen wir Deep Embedded Clustering (DEC) vor, eine Methode, die gleichzeitig Merkmalsrepräsentationen und Clusterzuordnungen mit tiefen neuronalen Netzen lernt. DEC lernt eine Abbildung vom Datenraum in einen niedrigdimensionalen Merkmalsraum, in dem es iterativ ein Clustervorhaben optimiert. Unsere experimentellen Auswertungen anhand von Bild- und Textkorpora zeigen erhebliche Verbesserungen gegenüber den bislang besten Methoden.