HyperAIHyperAI
vor 2 Monaten

Eine Neuronale Netzwerkarchitektur, die Gated Recurrent Unit (GRU) und Support Vector Machine (SVM) kombiniert, für die Erkennung von Eindringversuchen in Netzwerkverkehrsdaten

Abien Fred Agarap
Eine Neuronale Netzwerkarchitektur, die Gated Recurrent Unit (GRU) und Support Vector Machine (SVM) kombiniert, für die Erkennung von Eindringversuchen in Netzwerkverkehrsdaten
Abstract

Die Gated Recurrent Unit (GRU) ist eine neuerliche Variante der Long Short-Term Memory (LSTM)-Einheit, beide sind Arten von rekurrenten neuronalen Netzen (RNN). Durch empirische Beweise wurde nachgewiesen, dass beide Modelle in einer Vielzahl von Maschinelles-Lernen-Aufgaben wie der Natürlichen-Sprachverarbeitung (Wen et al., 2015), der Spracherkennung (Chorowski et al., 2015) und der Textklassifizierung (Yang et al., 2016) effektiv sind. Traditionell verwenden sowohl die meisten neuronalen Netze als auch die beiden oben genannten RNN-Varianten die Softmax-Funktion als letzte Ausgabeschicht für ihre Vorhersagen und die Kreuzentropiefunktion zur Berechnung ihres Verlusts. In dieser Arbeit schlagen wir eine Abweichung von dieser Norm vor, indem wir den linearen Support Vector Machine (SVM) als Ersatz für die Softmax-Funktion in der letzten Ausgabeschicht eines GRU-Modells einführen. Des Weiteren soll die Kreuzentropiefunktion durch eine margenbasierte Funktion ersetzt werden. Obwohl es ähnliche Studien gibt (Alalshekmubarak & Smith, 2013; Tang, 2013), richtet sich dieser Vorschlag primär auf binäre Klassifikation im Bereich der Eindringlingsdetektion unter Verwendung der Netzwerkverkehrsdaten aus dem Jahr 2013 von den Honeypot-Systemen der Universität Kyoto. Die Ergebnisse zeigen, dass das GRU-SVM-Modell vergleichsweise besser abschneidet als das konventionelle GRU-Softmax-Modell. Das vorgeschlagene Modell erreichte eine Trainingsgenauigkeit von etwa 81,54 % und eine Testgenauigkeit von etwa 84,15 %, während das letztere eine Trainingsgenauigkeit von etwa 63,07 % und eine Testgenauigkeit von etwa 70,75 % erzielte. Zudem deuten die Vergleiche zwischen diesen beiden Endausgabeschichten darauf hin, dass die SVM bei der Vorhersagezeit besser abschneiden würde – eine theoretische Implikation, die durch die tatsächlichen Trainings- und Testzeiten in dieser Studie gestützt wird.