Apprentissage par contraste hypergraphique pour la détection de communautés impliquées dans le trafic de drogues
Au cours des dernières décennies, en raison des profits élevés, le crime du trafic de drogues s’est développé en s’inspirant des technologies modernes. Les réseaux sociaux, en tant que l’un des principaux plateformes en ligne, sont devenus des intermédiaires directs entre les communautés de trafiquants illicites et les consommateurs, permettant la promotion et le commerce de drogues. Ces activités de trafic organisées par groupes posent des défis majeurs à la santé et à la sécurité publiques, nécessitant des mesures urgentes pour y faire face. Toutefois, les approches existantes pour lutter contre ce problème urgent restent limitées : elles analysent principalement les rôles individuels sous une seule perspective, négligent les relations au sein des groupes, et exigent un nombre suffisant d’échantillons étiquetés pour entraîner les modèles. À cet effet, nous proposons un nouveau cadre d’apprentissage contrastif hypergraphique, appelé HyGCL-DC, qui utilise les hypergraphes pour modéliser les relations d’ordre supérieur entre utilisateurs afin de détecter les communautés de trafic de drogues. Premièrement, nous construisons un hypergraphe nommé Twitter-HyDrug, comprenant des nœuds représentant des utilisateurs en ligne et quatre types d’hyperarêtes, afin de capturer les relations complexes au sein de ces groupes. Ensuite, nous exploitons des réseaux neuronaux hypergraphiques pour modéliser les relations riches entre les nœuds et les hyperarêtes dans cet hypergraphe de trafic de drogues. Par ailleurs, nous concevons un module d’apprentissage auto-supervisé par contraste basé sur les hypergraphes, intégrant des augmentations issues des perspectives structurelle et des attributs, afin d’améliorer l’apprentissage des représentations hypergraphiques sur des données non étiquetées. Enfin, nous proposons un cadre end-to-end combinant ce module de contraste auto-supervisé et un module supervisé pour classifier les communautés de trafic de drogues en ligne. Pour étudier de manière exhaustive le problème du trafic de drogues en ligne et évaluer notre modèle, nous menons des expériences étendues sur Twitter-HyDrug ainsi que sur trois jeux de données de référence hypergraphiques issues de citations, démontrant ainsi l’efficacité de notre approche. Nos nouvelles données et le code source sont disponibles à l’adresse suivante : https://github.com/GraphResearcher/HyGCL-DC.