Tiefes Clustering mit einem dynamischen Autoencoder: Von der Rekonstruktion hin zur Zentroidenbildung

Im Bereich des unüberwachten Lernens gibt es keine offensichtliche, direkte Kostenfunktion, die die wesentlichen Faktoren von Variationen und Ähnlichkeiten erfassen kann. Da natürliche Systeme glatte Dynamiken aufweisen, wird eine Chance verloren, wenn eine unüberwachte Zielfunktion während des Trainingsprozesses statisch bleibt. Der Mangel an konkreter Überwachung deutet darauf hin, dass glatte Dynamiken integriert werden sollten. Im Vergleich zu klassischen statischen Kostenfunktionen ermöglichen dynamische Zielfunktionen eine bessere Nutzung des schrittweise und unsicheren Wissens, das durch Pseudo-Überwachung erworben wird. In dieser Arbeit schlagen wir den Dynamic Autoencoder (DynAE) vor, ein neues Modell für tiefes Clustering, das einen Kompromiss zwischen Clustering und Rekonstruktion überwindet, indem es die Rekonstruktionszielfunktion schrittweise und glatt zugunsten einer Konstruktionszielfunktion eliminiert. Experimentelle Bewertungen an Benchmark-Datensätzen zeigen, dass unser Ansatz im Vergleich zu den relevantesten Methoden des tiefen Clusterings Stand der Technik ist.