17 天前

TII-SSRC-23 数据集:面向入侵检测的多样化交通模式类型学探索

Dania Herzalla, Willian T. Lunardi, Martin Andreoni Lopez
TII-SSRC-23 数据集:面向入侵检测的多样化交通模式类型学探索
摘要

基于机器学习的网络入侵检测系统(Network Intrusion Detection Systems, NIDS)的性能在很大程度上取决于其训练所用的数据集。确保数据集能够准确反映良性流量与恶意流量的多维度特征,对于构建能够识别并响应各类入侵模式的检测模型至关重要。然而,现有数据集普遍存在多样性不足、与当前网络环境脱节等问题,严重制约了入侵检测系统的实际效能。为此,本文提出一种新型且全面的数据集——TII-SSRC-23,旨在克服上述挑战。该数据集涵盖多种类型的网络流量及其子类型,具有高度的多样性与代表性,可作为研究社区开展相关研究的可靠且通用的工具。此外,本文还开展了特征重要性分析,揭示了在入侵检测任务中具有关键作用的特征,为模型优化提供了重要依据。通过大量实验,本文基于该数据集建立了监督学习与无监督学习方法的坚实基准(baselines),进一步推动了入侵检测模型在快速演进的网络安全部署环境中的适应性与进步。本数据集已公开发布,获取地址为:https://kaggle.com/datasets/daniaherzalla/tii-ssrc-23。