Amélioration des détecteurs de fraude basés sur les réseaux de neurones graphiques face à des fraudeurs camouflés

Les réseaux de neurones graphiques (GNN) ont été largement appliqués ces dernières années aux problèmes de détection de fraude, en évaluant le degré de suspicion d’un nœud à partir de l’agrégation de ses informations voisines via différentes relations. Toutefois, peu de travaux antérieurs ont pris en compte le comportement de camouflage adopté par les fraudeurs, qui peut nuire aux performances des détecteurs de fraude basés sur les GNN durant le processus d’agrégation. Dans cet article, nous introduisons deux types de camouflages fondés sur des études empiriques récentes : le camouflage de caractéristiques (feature camouflage) et le camouflage de relations (relation camouflage). Les GNN existants n’ont pas traité ces deux formes de camouflages, ce qui explique leur faible performance dans les tâches de détection de fraude. À la place, nous proposons un nouveau modèle nommé CARE-GNN (CAmouflage-REsistant GNN), conçu pour renforcer le processus d’agrégation des GNN grâce à trois modules spécifiques résistants au camouflage. Plus précisément, nous introduisons d’abord une mesure de similarité informée par les étiquettes afin d’identifier les voisins les plus informatifs. Ensuite, nous utilisons l’apprentissage par renforcement (RL) pour déterminer le nombre optimal de voisins à sélectionner. Enfin, les voisins sélectionnés provenant de différentes relations sont agrégés conjointement. Des expériences approfondies menées sur deux jeux de données réels de fraude démontrent l’efficacité de l’algorithme de renforcement. Le modèle CARE-GNN surpasser également les GNN les plus avancés ainsi que les détecteurs de fraude basés sur les GNN. Nous avons intégré tous les détecteurs de fraude basés sur les GNN dans une boîte à outils open source : https://github.com/safe-graph/DGFraud. Le code du CARE-GNN ainsi que les jeux de données sont disponibles à l’adresse suivante : https://github.com/YingtongDou/CARE-GNN.