17日前
TII-SSRC-23 データセット:侵入検出を目的とした多様な交通パターンの類型的探索
Dania Herzalla, Willian T. Lunardi, Martin Andreoni Lopez

要約
ネットワーク侵入検出システム(IDS)の効果性は、主に機械学習に基づくものであるが、その性能は訓練に用いられるデータセットに大きく左右される。多様な正常トラフィックと悪意あるトラフィックの特性を正確に反映するデータセットの構築が、さまざまな侵入パターンを識別・対応できるモデル開発の鍵となる。しかし、現存するデータセットはしばしばその多様性に欠け、現代のネットワーク環境に適切に整合していないため、侵入検出の効果性が制限されている。本論文では、こうした課題を克服するために、TII-SSRC-23と名付けられた新規かつ包括的なデータセットを提案する。本データセットは、多様なトラフィック種別およびサブタイプを含み、研究コミュニティにとって強固かつ汎用性の高いツールとなる。さらに、侵入検出タスクにおける重要な特徴量を明らかにするための特徴量重要度分析も実施している。広範な実験を通じて、本データセットを用いた教師ありおよび教師なし侵入検出手法に対する明確なベースラインを確立し、急速に変化するネットワークセキュリティ環境において、侵入検出モデルの進化と適応性向上に貢献している。本データセットは、https://kaggle.com/datasets/daniaherzalla/tii-ssrc-23 にて公開されている。