KiNETGAN : Permettre la détection distribuée des intrusions réseau grâce à la génération de données synthétiques infusées de connaissances

Dans le domaine des systèmes IoT/CPS connectés via des réseaux mobiles, les méthodes traditionnelles de détection d'intrusion analysent le trafic réseau sur plusieurs appareils en utilisant des techniques de détection d'anomalies pour signaler les menaces potentielles de sécurité. Cependant, ces méthodes sont confrontées à des défis importants en matière de confidentialité, notamment avec l'inspection approfondie des paquets et l'analyse des communications réseau. Ce type de surveillance est très intrusif car il implique l'examen du contenu des paquets de données, qui peuvent contenir des informations personnelles et sensibles. Une telle vérification des données est souvent soumise à des lois et réglementations strictes, en particulier dans des environnements comme les maisons intelligentes où la protection des données est primordiale. Les données synthétiques offrent une solution prometteuse en imitant le comportement réel du réseau sans révéler de détails sensibles. Des modèles génératifs tels que les Réseaux Antagonistes Génératifs (GANs) peuvent produire des données synthétiques, mais ils peinent souvent à générer des données réalistes dans des domaines spécialisés comme l'activité réseau. Cette limitation découle d'un manque de données d'entraînement suffisantes, ce qui entrave la capacité du modèle à comprendre adéquatement les règles et contraintes du domaine. De plus, la rareté des données d'entraînement aggrave le problème de déséquilibre de classe dans les méthodes de détection d'intrusion. Pour relever ces défis, nous proposons un cadre axé sur la confidentialité qui utilise un Réseau Antagoniste Génératif enrichi par la connaissance pour générer des données d'activité réseau synthétiques (KiNETGAN). Cette approche renforce la résilience de la détection distribuée d'intrusions tout en abordant les préoccupations liées à la confidentialité. Notre GAN guidé par la connaissance produit des représentations réalistes de l'activité réseau, validées par une expérimentation rigoureuse. Nous montrons que KiNETGAN maintient une perte minimale de précision dans les tâches en aval, équilibrant efficacement la confidentialité et l'utilité des données.