HyperAIHyperAI
vor 2 Monaten

Den Reklustering-Schranken in zentroidbasiertem tiefem Clustering überwinden

Lukas Miklautz; Timo Klein; Kevin Sidak; Collin Leiber; Thomas Lang; Andrii Shkabrii; Sebastian Tschiatschek; Claudia Plant
Den Reklustering-Schranken in zentroidbasiertem tiefem Clustering überwinden
Abstract

Diese Arbeit untersucht ein wichtiges Phänomen in zentroidbasierten Deep Clustering (DC) Algorithmen: Die Leistung sättigt sich nach einer Phase rascher früher Verbesserungen schnell ein. Praktiker begegnen der frühen Sättigung in der Regel durch periodisches Neuklusterung, was wir als unzureichend zur Überwindung von Leistungsplateaus nachweisen. Wir bezeichnen dieses Phänomen als die „Neuklusterungsschwelle“ und zeigen empirisch, wann die Neuklusterungsschwelle auftritt, welche ihre zugrundeliegenden Mechanismen sind und wie es möglich ist, die Neuklusterungsschwelle mit unserem Algorithmus BRB zu überwinden. BRB vermeidet eine frühzeitige Überbindung an initiale Klustervorgaben und ermöglicht eine kontinuierliche Anpassung an neu initialisierte Clustertziele, während es konzeptionell einfach bleibt. Durch die Anwendung unseres Algorithmus auf weit verbreitete zentroidbasierte DC-Algorithmen zeigen wir, dass (1) BRB die Leistung konsistent über einen breiten Spektrum von Clustering-Benchmarks verbessert, (2) BRB das Training von Grund auf ermöglicht und (3) BRB bei Kombination mit einem kontrastiven Verlust wettbewerbsfähig gegen den aktuellen Stand der Technik in DC-Algorithmen ist. Unser Code und vorab trainierte Modelle werden unter https://github.com/Probabilistic-and-Interactive-ML/breaking-the-reclustering-barrier veröffentlicht.

Den Reklustering-Schranken in zentroidbasiertem tiefem Clustering überwinden | Neueste Forschungsarbeiten | HyperAI