HyperAIHyperAI
il y a 9 jours

Choisir et sélectionner : une approche d'apprentissage déséquilibré basée sur les GNN pour la détection de fraude

{Qing He, Hao Yang, Jinghua Feng, Jianfeng Chi, Zidi Qin, Xiang Ao, Yang Liu1}
Résumé

Les approches basées sur les graphes pour la détection de fraude ont récemment suscité un intérêt croissant grâce à l’abondance d’informations relationnelles contenues dans les données structurées en graphes, qui peuvent s’avérer particulièrement utiles pour identifier les fraudeurs. Toutefois, les algorithmes fondés sur les réseaux de neurones graphiques (GNN) peinent souvent lorsqu’il y a un déséquilibre marqué dans la répartition des étiquettes des nœuds — une situation fréquente dans des domaines sensibles tels que la fraude financière. Afin de remédier au problème d’imbalanced learning dans la détection de fraude basée sur les graphes, nous proposons un modèle appelé Pick and Choose Graph Neural Network (PC-GNN), conçu pour l’apprentissage supervisé déséquilibré sur graphes. Premièrement, des nœuds et des arêtes sont sélectionnés à l’aide d’un échantillonneur spécifiquement conçu pour garantir un équilibre des étiquettes, afin de construire des sous-graphes adaptés à l’entraînement par mini-batch. Ensuite, pour chaque nœud du sous-graphe, les voisins candidats sont choisis grâce à un échantillonneur de voisinage proposé. Enfin, les informations provenant des voisins sélectionnés et des différentes relations sont agrégées pour obtenir la représentation finale du nœud cible. Des expérimentations menées sur des tâches de détection de fraude basées sur des graphes, tant sur des jeux de données standard que sur des données réelles, montrent que PC-GNN surpasse clairement les méthodes de pointe actuelles.