Exploration d’un cadre fondé sur des principes pour le clustering de sous-espaces profond

Le regroupement par sous-espaces est une tâche classique d’apprentissage non supervisé, fondée sur l’hypothèse de base selon laquelle les données à haute dimension peuvent être approximées par une union de sous-espaces (UoS). Toutefois, les données du monde réel s’écartent souvent de cette hypothèse. Pour relever ce défi, les algorithmes d’apprentissage profond de regroupement par sous-espaces les plus récents tentent d’apprendre simultanément les représentations UoS et les coefficients auto-expressifs. Néanmoins, le cadre général des algorithmes existants souffre d’un effondrement catastrophique des caractéristiques et ne dispose pas de garantie théorique pour apprendre des représentations UoS souhaitées. Dans cet article, nous proposons un cadre fondé sur des principes pour le regroupement par sous-espaces profond (PRO-DSC), conçu pour apprendre de manière unifiée des représentations structurées et des coefficients auto-expressifs. Plus précisément, dans PRO-DSC, nous introduisons une régularisation efficace sur les représentations apprises dans le cadre du modèle auto-expressif, et démontrons que ce modèle régularisé permet de prévenir l’effondrement de l’espace des caractéristiques, et que, sous certaines conditions, les représentations optimales apprises se situent effectivement sur une union de sous-espaces orthogonaux. En outre, nous proposons une approche évolutive et efficace pour implémenter notre PRO-DSC, et menons des expériences étendues afin de vérifier nos résultats théoriques et de démontrer la supériorité de notre approche de regroupement par sous-espaces profond.