Réseaux de Clustering en Sous-espaces Profonds

Nous présentons une nouvelle architecture de réseau neuronal profond pour le clustering de sous-espaces non supervisé. Cette architecture est basée sur des auto-encodeurs profonds, qui cartographient de manière non linéaire les données d'entrée dans un espace latent. Notre idée clé est d'introduire une nouvelle couche auto-expressive entre l'encodeur et le décodeur pour imiter la propriété d'« auto-expression » qui s'est révélée efficace dans le clustering de sous-espaces traditionnel. Étant différentiable, notre nouvelle couche auto-expressive offre une méthode simple mais efficace pour apprendre les affinités paires entre tous les points de données via une procédure standard de rétropropagation. Étant non linéaire, notre méthode basée sur les réseaux neuronaux est capable de regrouper des points de données ayant des structures complexes (souvent non linéaires). Nous proposons également des stratégies de pré-entraînement et d'affinage qui nous permettent d'apprendre efficacement les paramètres de nos réseaux de clustering de sous-espaces. Nos expériences montrent que la méthode proposée surpasse significativement les méthodes actuelles d'clustering de sous-espaces non supervisées.