Apprentissage de représentation pour le regroupement par diffusion de prototypes et échantillonnage positif

Les méthodes existantes de clustering profond reposent soit sur une apprentissage de représentation contrastif, soit sur une approche non contrastive pour les tâches de clustering ultérieures. Les méthodes basées sur le contraste, grâce à l’utilisation de paires négatives, permettent d’apprendre des représentations uniformes adaptées au clustering ; toutefois, ces paires négatives peuvent inévitablement entraîner un problème de collision de classes, compromettant ainsi la performance du clustering. À l’inverse, les méthodes non contrastives évitent ce problème de collision de classes, mais les représentations résultantes, non uniformes, peuvent provoquer un effondrement du clustering. Afin de tirer parti des avantages des deux approches, ce papier présente une nouvelle méthode de clustering profond end-to-end, appelée ProPos, basée sur une dissémination de prototypes et un échantillonnage de paires positives. Plus précisément, nous maximisons d’abord la distance entre les représentations prototypiques — une perte que nous nommons perte de dissémination de prototypes — afin d’améliorer l’uniformité des représentations. Ensuite, nous alignons une version augmentée d’un exemple avec les voisins échantillonnés d’une autre version — supposés constituer une vraie paire positive dans l’espace d’embedding — afin d’améliorer la compacité intra-cluster, une opération que nous désignons par alignement par échantillonnage de paires positives. Les forces de ProPos résident dans l’évitement du problème de collision de classes, l’obtention de représentations uniformes, la séparation nette des clusters et la compacité intra-cluster. En optimisant ProPos dans un cadre d’expectation-maximization end-to-end, les résultats expérimentaux étendus démontrent que ProPos atteint des performances compétitives sur des jeux de données de clustering de taille modérée et établit un nouveau record d’état de l’art sur des jeux de données à grande échelle. Le code source est disponible à l’adresse \url{https://github.com/Hzzone/ProPos}.