15일 전

기계 학습 모델을 활용한 컴퓨터 공격 탐지: CICIDS2017 데이터셋 기반의 종합적 접근

{Andrey Matskevich, Maxim Goryunov, Dmitry Rybolovlev}
초록

이 논문은 머신러닝 기법을 기반으로 한 컴퓨터 공격 탐지 모델의 구축 및 실용적 구현에 대해 다룬다. 공개된 데이터셋 중에서 가장 관련성이 높은 CICIDS2017 데이터셋을 선택하였다. 해당 데이터셋에 대해 데이터 전처리 및 샘플링 절차를 상세히 개발하였다. 계산 시간을 줄이기 위해 학습 데이터셋에는 브루트포스 공격, XSS, SQL 인젝션과 같은 특정 유형의 컴퓨터 공격 클래스만을 유지하였다. 특징 공간 구성 절차를 순차적으로 기술함으로써 특징 차원을 기존의 85차원에서 10개의 가장 중요한 특징으로 크게 감소시켰다. 전처리된 데이터셋을 기반으로 일반적으로 사용되는 10개의 머신러닝 모델의 성능을 평가하였다. k-최근접이웃, 의사결정나무, 랜덤 포레스트, AdaBoost, 로지스틱 회귀 등 최고의 성능을 보인 모델들 중에서 실행 시간이 최소인 랜덤 포레스트 모델을 선택하는 것이 타당함을 입증하였다. 하이퍼파라미터에 대한 준최적의 선택을 통해 기존에 발표된 연구 결과보다 모델의 성능을 개선했다. 합성된 공격 탐지 모델은 실제 네트워크 트래픽을 대상으로 테스트되었으며, 모델의 유효성은 특정 네트워크 환경에서 수집된 데이터로 학습된 경우에만 확인되었다. 이는 중요한 특징들이 네트워크의 물리적 구조 및 사용된 장비 설정에 따라 달라지기 때문이다. 따라서 이러한 제약 조건을 고려할 때 머신러닝 기법을 활용한 컴퓨터 공격 탐지가 가능함을 결론지었다.

기계 학습 모델을 활용한 컴퓨터 공격 탐지: CICIDS2017 데이터셋 기반의 종합적 접근 | 최신 연구 논문 | HyperAI초신경