Réseau de convolution de graphe guidé par l’homophilie de voisinage

Les réseaux de neurones graphiques (GNN) se sont révélés puissants pour les tâches orientées graphes. Toutefois, de nombreux graphes du monde réel présentent une hétérophilie, ce qui remet en cause l’hypothèse d’homophilie des GNN classiques. Pour résoudre le problème de généralisation, de nombreuses études ont approfondi les architectures ou concaténé des représentations intermédiaires, ce qui ne change pas fondamentalement l’agrégation des voisins et introduit du bruit. Des travaux récents ont proposé de nouvelles métriques pour caractériser l’homophilie, mais rares sont ceux qui examinent la corrélation entre ces métriques et les modèles. Dans cet article, nous proposons tout d’abord une nouvelle métrique, appelée Homophilie de Voisinage (NH), destinée à mesurer la complexité ou la pureté des étiquettes au sein des voisinages des nœuds. Ensuite, nous intégrons cette métrique dans l’architecture classique du réseau de convolution graphique (GCN) et proposons un modèle appelé NHGCN, basé sur l’homophilie de voisinage. Dans ce cadre, les voisins sont regroupés selon des valeurs estimées de NH et agrégés à partir de canaux distincts, tandis que les prédictions obtenues pour chaque nœud sont ultérieurement utilisées pour estimer et mettre à jour les valeurs de NH. Les deux processus d’estimation de la métrique et d’inférence du modèle sont optimisés de manière itérative afin d’améliorer la classification des nœuds. Le modèle NHGCN atteint des performances optimales sur des benchmarks à la fois homophiles et hétérophiles, avec une amélioration pouvant atteindre 7,4 % par rapport aux méthodes de l’état de l’art actuelles.