HyperAIHyperAI
il y a 11 jours

Clustering imbriqué profond adversaire : vers un meilleur compromis entre aléatoire des caractéristiques et dérive des caractéristiques

Nairouz Mrabah, Mohamed Bouguessa, Riadh Ksantini
Clustering imbriqué profond adversaire : vers un meilleur compromis entre aléatoire des caractéristiques et dérive des caractéristiques
Résumé

Le regroupement basé sur les autoencodeurs profonds a fait l’objet d’une étude approfondie au cours des dernières années. Les approches actuelles reposent sur l’apprentissage simultané de caractéristiques intégrées et du regroupement des points de données dans l’espace latent. Bien que de nombreuses méthodes de regroupement profond surpassent les modèles peu profonds en obtenant de bons résultats sur plusieurs jeux de données à haute sémantique, une faiblesse critique de ces modèles a été négligée. En l’absence de signaux de supervision concrets, la fonction objectif de regroupement intégré peut déformer l’espace latent en s’appuyant sur des pseudo-étiquettes non fiables. Par conséquent, le réseau peut apprendre des caractéristiques non représentatives, ce qui affaiblit à son tour sa capacité discriminative et conduit à des pseudo-étiquettes de pire qualité. Afin de réduire l’impact des caractéristiques discriminatives aléatoires, les travaux récents sur le regroupement basé sur les autoencodeurs proposent d’utiliser la perte de reconstruction pour le pré-entraînement ainsi qu’un régularisateur durant la phase de regroupement. Toutefois, un compromis entre regroupement et reconstruction peut entraîner le phénomène de Drift des caractéristiques (Feature Drift). Dans cet article, nous proposons ADEC (Adversarial Deep Embedded Clustering), un nouveau modèle de regroupement basé sur les autoencodeurs, qui traite simultanément deux problèmes fondamentaux : la randomisation des caractéristiques (Feature Randomness) et le drift des caractéristiques, grâce à une formation adversaire. Nous démontrons empiriquement l’efficacité de notre modèle dans la gestion de ces problèmes sur des jeux de données réels standard. Les résultats expérimentaux confirment que notre modèle surpasser les méthodes de regroupement basées sur les autoencodeurs les plus avancées à l’état de l’art.

Clustering imbriqué profond adversaire : vers un meilleur compromis entre aléatoire des caractéristiques et dérive des caractéristiques | Articles de recherche récents | HyperAI