Deep Clustering mit concrete k-Means

Wir behandeln das Problem der gleichzeitigen Lernung einer k-Means-Clustering- und einer tiefen Merkmalsdarstellung aus unbeschrifteten Daten, was aufgrund des Potenzials von Deep k-Means, traditionelle zweistufige Merkmalsextraktions- und shallow-Clustering-Strategien zu überbieten, von großem Interesse ist. Wir erreichen dies durch die Entwicklung eines Gradientenschätzers für das nicht differenzierbare k-Means-Ziel durch die Gumbel-Softmax-Reparameterisationstechnik. Im Gegensatz zu früheren Ansätzen im Bereich des Deep Clustering kann unser konkretes k-Means-Modell hinsichtlich des klassischen k-Means-Ziels optimiert werden und lässt sich einfach end-to-end trainieren, ohne auf alternierende Optimierung zurückgreifen zu müssen. Wir belegen die Wirksamkeit unserer Methode anhand standardisierter Clustering-Benchmarks.