Minage Profond et Complet des Correlations pour le Regroupement d'Images

Les méthodes d'apprentissage profond non supervisées récemment développées permettent d'apprendre conjointement la représentation et de regrouper des données non étiquetées. Ces méthodes de clustering profond se concentrent principalement sur les corrélations entre les échantillons, par exemple en sélectionnant des paires à haute précision pour ajuster progressivement la représentation des caractéristiques, ce qui néglige d'autres corrélations utiles. Dans cet article, nous proposons un nouveau cadre de clustering, nommé deep comprehensive correlation mining (DCCM), visant à explorer et tirer pleinement parti des différentes sortes de corrélations sous-jacentes aux données non étiquetées sous trois angles : 1) Au lieu de n'utiliser que des informations par paires, une supervision par pseudo-étiquettes est proposée pour examiner les informations catégorielles et apprendre des caractéristiques discriminantes. 2) La robustesse des caractéristiques face aux transformations d'image dans l'espace d'entrée est pleinement explorée, ce qui bénéficie à l'apprentissage du réseau et améliore considérablement les performances. 3) L'information mutuelle triplet entre les caractéristiques est introduite pour le problème de clustering afin de porter l'information mutuelle profonde au niveau des instances récemment découverte à une formation au niveau triplet, ce qui aide davantage à apprendre des caractéristiques plus discriminantes. De nombreuses expériences menées sur plusieurs jeux de données difficiles montrent que notre méthode atteint de bonnes performances, par exemple en obtenant une précision de clustering de $62{,}3\%$ sur CIFAR-10, soit $10{,}1\%$ supérieure aux résultats les plus avancés actuellement disponibles.