17일 전
TII-SSRC-23 데이터셋: 침입 탐지를 위한 다양한 교통 패턴의 유형학적 탐색
Dania Herzalla, Willian T. Lunardi, Martin Andreoni Lopez

초록
기계 학습 기반의 네트워크 침입 탐지 시스템의 효과성은 주로 학습에 사용되는 데이터셋에 크게 영향을 받는다. 다양한 정상 및 악성 트래픽 패턴을 정확히 반영할 수 있도록 데이터셋의 구성이 다층적이고 현실적인 네트워크 환경에 부합해야만, 다양한 침입 패턴을 인식하고 대응할 수 있는 모델을 개발할 수 있다. 그러나 기존의 데이터셋들은 종종 충분한 다양성과 현대 네트워크 환경에 대한 적합성을 결여하고 있어, 침입 탐지 시스템의 성능을 제한하고 있다. 본 논문에서는 이러한 문제를 극복하기 위해 설계된 새로운 종합적인 데이터셋인 TII-SSRC-23을 제안한다. 다양한 트래픽 유형과 하위 유형을 포함한 본 데이터셋은 연구 공동체가 활용할 수 있는 강력하고 다용도적인 도구로 기능할 수 있다. 또한, 침입 탐지 작업에서 핵심적인 역할을 하는 특징들에 대한 중요도 분석을 수행하여 중요한 특징에 대한 귀중한 통찰을 제공한다. 광범위한 실험을 통해 본 데이터셋을 기반으로 한 지도 학습 및 비지도 학습 기반의 침입 탐지 방법론에 대해 명확한 기준 성능을 설정하였으며, 이는 빠르게 변화하는 네트워크 보안 환경 속에서 침입 탐지 모델의 발전과 적응력 향상에 기여한다. 본 데이터셋은 https://kaggle.com/datasets/daniaherzalla/tii-ssrc-23에서 공개되어 있다.