Apprentissage des représentations de graphes au-delà des nœuds et de l'homophilie

L'apprentissage non supervisé de représentations de graphes vise à extraire diverses informations présentes dans un graphe afin d'obtenir une représentation dense, indépendante des tâches ultérieures. Toutefois, les approches existantes d'apprentissage de représentations de graphes sont principalement conçues sous l'hypothèse d'homophilie des nœuds : des nœuds connectés ont tendance à posséder des étiquettes similaires, et leur performance est optimisée pour des tâches centrées sur les nœuds. Cette conception va clairement à l'encontre du principe d'indépendance par rapport à la tâche et se traduit généralement par de mauvaises performances dans des tâches telles que la classification d'arêtes, qui exigent des signaux fonctionnels allant au-delà de la perspective du nœud et de l'hypothèse d'homophilie. Pour intégrer efficacement différents types de signaux fonctionnels dans les représentations, ce papier propose PairE, une nouvelle méthode non supervisée d'embedding de graphes qui utilise deux nœuds jumeaux comme unité fondamentale d'encodage, afin de préserver les signaux à haute fréquence entre les nœuds et ainsi soutenir à la fois les tâches liées aux nœuds et celles liées aux arêtes. En conséquence, un autoencodeur multi-self-supervisé est conçu pour réaliser deux tâches prétextes : l'une vise à mieux préserver les signaux à haute fréquence, tandis que l'autre renforce la représentation des éléments communs. Nos expériences étendues sur une diversité de jeux de données de référence montrent clairement que PairE surpasser les meilleures méthodes non supervisées existantes, avec une amélioration relative maximale de 101,1 % sur les tâches de classification d'arêtes, qui reposent à la fois sur les signaux à haute et à basse fréquence présents dans les paires, et jusqu'à 82,5 % de gain relatif sur les tâches de classification de nœuds.