Apprentissage de représentations favorisant le regroupement par discrimination d'instances et décorrélation des caractéristiques

Le regroupement (clustering) constitue l'une des tâches fondamentales en apprentissage automatique. Récemment, le clustering profond est devenu une tendance majeure dans les méthodes de regroupement. L'apprentissage de représentations joue souvent un rôle crucial dans l'efficacité du clustering profond, et peut ainsi être une cause principale de dégradation des performances. Dans cet article, nous proposons une méthode d'apprentissage de représentations adaptée au clustering, basée sur la discrimination d'instances et la décorrélation des caractéristiques. Notre méthode d'apprentissage de représentations fondée sur les réseaux de neurones s'inspire des propriétés du clustering spectral classique. La discrimination d'instances permet d'apprendre les similarités entre les données, tandis que la décorrélation des caractéristiques élimine les corrélations redondantes entre celles-ci. Nous utilisons une méthode de discrimination d'instances où l'apprentissage de classes individuelles d'instances conduit à l'acquisition de similarités entre celles-ci. À travers des expériences détaillées et une analyse approfondie, nous démontrons que notre approche peut être adaptée à l'apprentissage d'un espace latent adapté au clustering. Nous proposons de nouveaux contraintes de décorrélation formulées sous forme de softmax. Les évaluations sur le regroupement d'images utilisant CIFAR-10 et ImageNet-10 montrent que notre méthode atteint des taux de précision de 81,5 % et 95,4 %, respectivement. Nous montrons également que les contraintes formulées sous forme de softmax sont compatibles avec diverses architectures de réseaux de neurones.