RLC-GNN : Une architecture profonde améliorée pour les réseaux de neurones graphes basés sur l'espace, appliquée à la détection de fraude
Les réseaux de neurones graphiques (GNN) se sont avérés particulièrement efficaces pour résoudre des tâches de détection de fraude. Les algorithmes de détection basés sur les GNN apprennent des embeddings de nœuds en agrégant des informations provenant des voisins. Récemment, l’algorithme CAmouflage-REsistant GNN (CARE-GNN) a été proposé, atteignant des résultats de pointe dans les tâches de détection de fraude en traitant à la fois les camouflages relationnels et les camouflages fonctionnels. Toutefois, la mise en cascade de plusieurs couches selon la méthode classique définie par le nombre d’itérations (hop) entraîne une dégradation rapide des performances. Comme un seul niveau de CARE-GNN ne peut extraire suffisamment d’informations pour corriger les erreurs potentielles, les performances dépendent fortement de cette unique couche. Afin d’éviter ce phénomène lié à l’apprentissage mono-couche, nous proposons dans cet article une architecture multi-couches qui établit une relation complémentaire avec la structure résiduelle. Nous introduisons un algorithme amélioré nommé Residual Layered CARE-GNN (RLC-GNN). Ce nouvel algorithme apprend progressivement couche par couche et corrige continuellement les erreurs. Nous évaluons l’algorithme proposé à l’aide de trois métriques : rappel (recall), AUC et score F1. Des expériences numériques sont menées. Sur le jeu de données Yelp, nous obtenons des améliorations maximales de 5,66 %, 7,72 % et 9,09 % respectivement en rappel, AUC et score F1. De plus, sur le jeu de données Amazon, nous obtenons également des gains maximums de 3,66 %, 4,27 % et 3,25 % sur les mêmes trois métriques.