HyperAIHyperAI
il y a 8 jours

GEMSEC : Intégration de graphes avec clustering auto-organisé

{Ryan Davies, Benedek Rozemberczki, Charles Sutton, Rik Sarkar}
GEMSEC : Intégration de graphes avec clustering auto-organisé
Résumé

Les méthodes modernes d’embedding de graphes permettent d’extraire efficacement des caractéristiques des nœuds à partir de graphes comptant des millions de nœuds. Ces caractéristiques sont ultérieurement utilisées comme entrées pour des tâches prédictives en aval. Dans cet article, nous proposons GEMSEC, un algorithme d’embedding de graphes qui apprend simultanément une partition des nœuds en groupes et le calcul de leurs caractéristiques. Cette méthode place les nœuds dans un espace de caractéristiques abstrait, où les caractéristiques des sommets minimisent la log-vraisemblance négative associée à la préservation des voisinages échantillonnés, tout en regroupant les nœuds en un nombre fixe de clusters au sein de cet espace. GEMSEC constitue une extension générale des travaux antérieurs dans ce domaine, car elle s’inscrit comme une extension de la problématique d’optimisation fondamentale des méthodes d’embedding basées sur des séquences, tout en étant indépendante de la stratégie d’échantillonnage des voisinages. Nous montrons que GEMSEC extrait des clusters de haute qualité sur des réseaux sociaux du monde réel, et se compare favorablement à d’autres algorithmes de détection de communautés. Nous démontrons également que la contrainte de clustering améliore positivement la qualité des représentations, et que notre méthode apprend à intégrer de manière robuste et évolutive l’embedding et le regroupement des graphes.

GEMSEC : Intégration de graphes avec clustering auto-organisé | Articles de recherche récents | HyperAI