COMPLÉTER : Clusterisation multi-vues incomplète via prédiction contrastive
Dans cet article, nous étudions deux problèmes difficiles dans l’analyse de regroupement multi-vues incomplètes, à savoir : i) comment apprendre une représentation informative et cohérente entre différentes vues sans l’aide d’étiquettes, et ii) comment reconstruire les vues manquantes à partir des données. À cette fin, nous proposons une nouvelle fonction objectif qui intègre l’apprentissage de représentations et la récupération de données dans un cadre unifié, fondé sur la théorie de l’information. Plus précisément, la représentation informative et cohérente est apprise en maximisant l’information mutuelle entre différentes vues via l’apprentissage contrastif, tandis que les vues manquantes sont reconstruites en minimisant l’entropie conditionnelle entre les vues à l’aide d’une prédiction double. À notre connaissance, ce travail pourrait être le premier à offrir un cadre théorique unifiant l’apprentissage de représentations cohérentes et la récupération de données entre vues. Les résultats expérimentaux étendus montrent que la méthode proposée surpasse significativement 10 méthodes concurrentes de regroupement multi-vues sur quatre jeux de données exigeants. Le code est disponible à l’adresse suivante : https://pengxi.me.