Une architecture de réseau neuronal combinant l'unité de récurrence à porte (GRU) et la machine à vecteurs de support (SVM) pour la détection d'intrusions dans les données de trafic réseau

L'unité à récurrence contrôlée (Gated Recurrent Unit, GRU) est une variante récente de l'unité de mémoire à court et long terme (Long Short-Term Memory, LSTM), toutes deux étant des types de réseau neuronal récurrent (Recurrent Neural Network, RNN). Des preuves empiriques ont montré que ces deux modèles sont efficaces dans une grande variété de tâches d'apprentissage automatique, telles que le traitement du langage naturel (Wen et al., 2015), la reconnaissance vocale (Chorowski et al., 2015) et la classification de texte (Yang et al., 2016). Traditionnellement, comme pour la plupart des réseaux neuronaux, les deux variantes de RNN mentionnées ci-dessus utilisent la fonction Softmax en tant que couche de sortie finale pour leurs prédictions, ainsi que la fonction d'entropie croisée pour calculer leur perte. Dans cet article, nous proposons une modification de cette norme en introduisant une machine à vecteurs de support linéaire (Support Vector Machine, SVM) comme remplacement de la fonction Softmax dans la couche de sortie finale d'un modèle GRU. De plus, la fonction d'entropie croisée sera remplacée par une fonction basée sur les marges. Bien qu'il existe des études similaires (Alalshekmubarak & Smith, 2013 ; Tang, 2013), cette proposition est principalement destinée à la classification binaire pour la détection d'intrusion en utilisant les données de trafic réseau de 2013 provenant des systèmes piégés (honeypot systems) de l'Université de Kyoto. Les résultats montrent que le modèle GRU-SVM performe relativement mieux que le modèle GRU-Softmax conventionnel. Le modèle proposé a atteint une précision d'entraînement d'environ 81,54 % et une précision de test d'environ 84,15 %, tandis que ce dernier a atteint une précision d'entraînement d'environ 63,07 % et une précision de test d'environ 70,75 %. En outre, la comparaison entre ces deux couches finales indique que la SVM surpassera Softmax en temps de prédiction - une implication théorique qui a été confirmée par les temps effectifs d'entraînement et de test dans l'étude.