Harte Regularisierung zur Verhinderung des Zusammenbruchs tiefen Online-Clusterns ohne Datenverstärkung

Online-Tiefes Clustern bezieht sich auf die gemeinsame Verwendung eines Merkmalsextraktionsnetzes und eines Clustermodells, um Clusterlabels jedem neuen Datenpunkt oder jeder neuen Batch zuzuweisen, während diese verarbeitet werden. Obwohl schneller und vielseitiger als Offline-Methoden, kann Online-Clustern leicht eine kollabierte Lösung erreichen, bei der der Encoder alle Eingaben auf denselben Punkt abbildet und alle in ein einziges Cluster fallen. Erfolgreiche bestehende Modelle haben verschiedene Techniken eingesetzt, um dieses Problem zu vermeiden; die meisten davon erfordern Data Augmentation oder zielen darauf ab, die durchschnittliche weiche Zuordnung über den Datensatz für jedes Cluster gleich zu machen. Wir schlagen eine Methode vor, die keine Data Augmentation benötigt und im Gegensatz zu existierenden Methoden die harten Zuordnungen reguliert. Unter Verwendung eines bayesischen Rahmens leiten wir ein intuitives Optimierungskriterium ab, das einfach in das Training des Encoder-Netzes integriert werden kann. Getestet wurde unsere Methode anhand von vier Bild-Datensätzen und einem Datensatz zur Aktivitätserkennung bei Menschen. Sie vermeidet den Kollaps konsequenter und robuster als andere Methoden und führt zu genauerem Clustern. Zudem führen wir weitere Experimente und Analysen durch, die unsere Wahl, die harten Clusterzuordnungen zu regulieren, rechtfertigen. Der Quellcode ist unter https://github.com/Lou1sM/online_hard_clustering verfügbar.