il y a 11 jours

Réinterpréter les modèles de graph auto-encodeurs pour le regroupement de graphes attribués

Nairouz Mrabah, Mohamed Bouguessa, Mohamed Fawzi Touati, Riadh Ksantini

Résumé

La plupart des méthodes récentes de regroupement de graphes ont recours aux Auto-encodeurs de graphes (GAE, Graph Auto-Encoders) afin de réaliser conjointement l’apprentissage des embeddings et le regroupement. Toutefois, deux problèmes critiques ont été négligés. Premièrement, l’erreur cumulative induite par l’apprentissage à partir d’affectations de regroupement bruitées réduit l’efficacité et la robustesse du modèle de regroupement. Ce phénomène est désigné sous le nom de Randomité des caractéristiques (Feature Randomness). Deuxièmement, la reconstruction de la matrice d’adjacence amène le modèle à apprendre des similarités non pertinentes pour la tâche de regroupement. Ce problème est qualifié de Dérive des caractéristiques (Feature Drift). De manière intéressante, la relation théorique entre ces deux problèmes n’a pas encore été explorée. Nous étudions ces questions sous deux angles : (1) il existe un compromis entre la Randomité des caractéristiques et la Dérive des caractéristiques lorsque le regroupement et la reconstruction sont effectués au même niveau ; (2) le problème de Dérive des caractéristiques est plus marqué dans les modèles GAE que dans les auto-encodeurs classiques, en raison de l’opération de convolution sur graphe et de la conception du décodeur graphique. Motivés par ces constatations, nous reformulons la méthodologie de regroupement basée sur les GAE. Notre solution repose sur deux volets. Premièrement, nous proposons un opérateur d’échantillonnage $Ξ$ qui active un mécanisme de protection contre les affectations de regroupement bruitées. Deuxièmement, nous introduisons un opérateur $Υ$ qui déclenche un mécanisme de correction contre la Dérive des caractéristiques en transformant progressivement le graphe reconstruit en un graphe orienté vers le regroupement. Parmi les principaux avantages de notre approche, on note une amélioration significative de l’efficacité et de la robustesse du regroupement, ainsi qu’une facilité d’intégration aux modèles GAE existants.