L'hétérophilie est-elle un cauchemar réel pour les réseaux de neurones graphes en classification de nœuds ?

Les réseaux de neurones graphiques (GNNs) étendent les réseaux de neurones (NNs) classiques en exploitant les structures de graphe fondées sur une biais inductif relationnel (hypothèse d’homophilie). Bien que les GNNs soient généralement considérés comme supérieurs aux NNs dans les tâches du monde réel, leurs avantages en performance par rapport aux NNs indifférents aux graphes semblent ne pas être universellement satisfaisants. L’hétérophilie a été identifiée comme une cause principale, et de nombreuses études ont été proposées pour y remédier. Dans cet article, nous montrons d’abord que toutes les formes d’hétérophilie ne sont pas néfastes aux GNNs lorsqu’ils utilisent une opération d’agrégation. Ensuite, nous proposons de nouveaux indicateurs basés sur une matrice de similarité, prenant en compte l’impact à la fois de la structure du graphe et des caractéristiques d’entrée sur les GNNs. Ces indicateurs se révèlent supérieurs aux métriques d’homophilie couramment utilisées, selon des tests menés sur des graphes synthétiques. À partir de ces métriques et des observations associées, nous constatons que certaines formes d’hétérophilie nuisibles peuvent être atténuées par une opération de diversification. En s’appuyant sur cette constatation et sur les principes des filtres à bancs (filterbanks), nous proposons le cadre adaptatif d’agrégation mixte (Adaptive Channel Mixing, ACM), qui permet d’exploiter de manière adaptative les canaux d’agrégation, de diversification et d’identité dans chaque couche des GNNs afin de contrer l’hétérophilie nuisible. Nous validons les modèles améliorés par ACM sur 10 tâches réelles de classification de nœuds. Ces modèles obtiennent de manière cohérente des gains significatifs de performance et surpassent l’état de l’art des GNNs sur la plupart des tâches, sans engendrer de charge computationnelle notable.