Au-delà de l'homophilie dans les réseaux neuronaux graphiques : limitations actuelles et conceptions efficaces

Nous examinons la puissance de représentation des réseaux neuronaux sur graphes (GNN) dans la tâche de classification de nœuds semi-supervisée en présence d'hétérophylie ou d'une faible homophilie, c'est-à-dire dans des réseaux où les nœuds connectés peuvent avoir des étiquettes de classe différentes et des caractéristiques dissemblables. De nombreux GNN populaires échouent à généraliser à ce contexte et sont même surpassés par des modèles qui ignorent la structure du graphe (par exemple, perceptrons multicouches). Inspirés par cette limitation, nous identifions un ensemble de conceptions clés -- séparation des plongements ego et voisin, voisinages d'ordre supérieur, et combinaison des représentations intermédiaires -- qui améliorent l'apprentissage à partir de la structure du graphe en présence d'hétérophylie. Nous les combinons dans un réseau neuronal sur graphe, H2GCN, que nous utilisons comme méthode de base pour évaluer empiriquement l'efficacité des conceptions identifiées. Au-delà des benchmarks traditionnels avec une forte homophilie, notre analyse empirique montre que les conceptions identifiées augmentent la précision des GNN jusqu'à 40 % et 27 % par rapport aux modèles sans ces conceptions sur des réseaux synthétiques et réels avec hétérophylie, respectivement, tout en offrant une performance compétitive sous homophilie.