Zwillingskontrastives Lernen für Online-Clustering

Dieses Papier schlägt eine Online-Clusterverfahren vor, indem es Twin Contrastive Learning (TCL) auf Instanzebene und Clusterebene durchführt. Insbesondere stellen wir fest, dass, wenn die Daten in einen Merkmalsraum mit der Dimensionalität der Zielclusterzahl projiziert werden, die Zeilen und Spalten ihrer Merkmalsmatrix den Instanz- und Clustervorstellungen entsprechen. Auf dieser Beobachtung basierend konstruiert das vorgeschlagene TCL für einen gegebenen Datensatz zunächst positive und negative Paare durch Datenverstärkungen. Anschließend werden in den Zeilen- und Spaltenräumen der Merkmalsmatrix Instanz- und Clustervergleichslernen jeweils durchgeführt, indem positive Paare zusammengezogen und negative Paare auseinandergetrieben werden. Um den Einfluss intrinsischer Falsch-Negative-Paare zu mildern und Clusterzuordnungen zu korrigieren, verwenden wir ein vertrauensbasiertes Kriterium zur Auswahl von Pseudo-Etiketten, um sowohl das Instanz- als auch das Clustervergleichslernen zu stärken. Als Ergebnis wird die Clustervorhersageleistung weiter verbessert. Neben der eleganten Idee des Twin Contrastive Learnings ist ein weiterer Vorteil des TCL, dass es die Clusterzuordnung für jede Instanz unabhängig voraussagen kann, wodurch es sich nahtlos an Online-Szenarien anpasst. Ausführliche Experimente an sechs weit verbreiteten Bild- und Textbenchmarks zeigen die Effektivität des TCL. Der Code wird auf GitHub veröffentlicht werden.请注意,虽然您的要求中提到“使其更符合法语读者的阅读习惯”,但您需要的是德语翻译。因此,我已根据德语的阅读习惯进行了调整。希望这能符合您的需求。