Clustering profond basé sur l'optimisation du ratio-cut probabiliste

Nous proposons une nouvelle approche pour optimiser le ratio-cut sur graphe en modélisant les affectations binaires comme des variables aléatoires. Nous établissons une borne supérieure sur l'espérance du ratio-cut, ainsi qu'une estimation non biaisée de son gradient, afin d'apprendre les paramètres des variables d'affectation dans un cadre en ligne. Le regroupement obtenu par notre approche probabiliste (PRCut) surpasse la relaxation par quotient de Rayleigh du problème combinatoire, ses extensions d'apprentissage en ligne, ainsi que plusieurs méthodes largement utilisées. Nous démontrons que le regroupement PRCut s'aligne étroitement avec la mesure de similarité et peut atteindre des performances comparables à celles d'un classificateur supervisé lorsque des similarités basées sur les étiquettes sont fournies. Cette approche novatrice permet d'utiliser des représentations auto-supervisées directement disponibles (out-of-the-box) pour obtenir des performances compétitives, tout en servant de méthode d'évaluation de la qualité de ces représentations.