Clustering par sous-espaces à double stochasticité

De nombreuses méthodes de clustering par sous-espaces de pointe suivent un processus en deux étapes : elles construisent d’abord une matrice d’affinité entre les points de données, puis appliquent un clustering spectral à cette matrice. La majeure partie des recherches portant sur ces méthodes se concentre sur la première étape, à savoir la génération de l’affinité, qui exploite souvent la propriété d’auto-expression des sous-espaces linéaires, tandis que l’étape de clustering spectral, qui produit le résultat final, reçoit généralement peu d’attention. En outre, les méthodes existantes obtiennent souvent la matrice d’affinité finale utilisée dans l’étape de clustering spectral en appliquant des post-traitements ad hoc ou arbitrairement choisis à l’affinité produite par une formulation de clustering auto-expressive, ce qui peut avoir un impact significatif sur les performances globales du clustering. Dans ce travail, nous unifions ces deux étapes en apprenant simultanément une représentation auto-expressive des données et une matrice d’affinité bien normalisée pour le clustering spectral. Dans nos modèles proposés, nous imposons à la matrice d’affinité d’être doublement stochastique, ce qui conduit à une méthode fondée sur des principes solides pour la normalisation de la matrice d’affinité, tout en exploitant les avantages connus de la normalisation doublement stochastique dans le cadre du clustering spectral. Nous développons un cadre général et en dérivons deux modèles : l’un apprend conjointement la représentation auto-expressive et l’affinité doublement stochastique, tandis que l’autre résout séquentiellement les deux composantes, l’une après l’autre. Par ailleurs, nous exploitons la parcimonie du problème pour concevoir une méthode rapide basée sur un ensemble actif pour le solveur séquentiel, permettant un calcul efficace sur de grands ensembles de données. Des expériences montrent que notre méthode atteint des performances de clustering par sous-espaces de pointe sur de nombreuses bases de données courantes en vision par ordinateur.