SplitGNN : Réseau de neurones graphiques spectraux pour la détection de fraude en présence d'hétérophilie
Les fraudeurs dans le monde réel ajoutent fréquemment des liens légitimes tout en dissimulant leurs liens directs grâce à d'autres fraudeurs, ce qui entraîne une hétérophilie dans les graphes de fraude — un problème que la plupart des méthodes basées sur les réseaux de neurones graphiques (GNN) ne sont pas conçues pour résoudre. Plusieurs travaux ont été proposés pour aborder cette question depuis le domaine spatial. Toutefois, les recherches visant à traiter le problème de l’hétérophilie dans le domaine spectral restent limitées, en raison d’un manque de compréhension de la répartition de l’énergie spectrale dans les graphes présentant une hétérophilie. Dans cet article, nous analysons la distribution spectrale pour différentes degrés d’hétérophilie et observons que l’hétérophilie des nœuds frauduleux entraîne un déplacement de l’énergie spectrale des basses fréquences vers les hautes fréquences. Par ailleurs, nous vérifions que la division du graphe en utilisant des arêtes hétérophiles et homophiles permet d’obtenir des représentations plus significatives des signaux dans différentes bandes de fréquence. Cette observation nous pousse à proposer un nouveau modèle, SplitGNN, un réseau de neurones graphiques spectral conçu pour capturer les signaux en vue de la détection de fraude face à l’hétérophilie. SplitGNN utilise un classificateur d’arêtes pour diviser le graphe d’origine et adopte des filtres graphiques passe-bande flexibles afin d’apprendre des représentations. Des expériences étendues sur des jeux de données réels démontrent l’efficacité de notre méthode. Le code et les données sont disponibles à l’adresse suivante : https://github.com/Split-GNN/SplitGNN.