17일 전

이미지로 표현된 악성코드의 분류를 위한 합성곱 신경망의 활용

{Jordi Planes & Ramon Vicens, Carles Mateu, Daniel Gibert}
초록

매년 감지되는 악성 파일의 수는 수백만 건에 이른다. 이러한 다양한 파일이 대량으로 발생하는 주요 원인 중 하나는, 감지 회피를 위해 악성 소프트웨어 작성자가 변이(mutation)를 추가하기 때문이다. 즉, 동일한 악성 행동을 가지는 동일한 가족에 속하는 악성 파일들이 여러 기법을 활용해 지속적으로 수정되거나 오버플루이션(obfuscation)되며, 결과적으로 서로 다른 파일처럼 보이게 된다. 이러한 방대한 양의 파일을 효과적으로 분석하고 분류하기 위해서는 파일들을 그 행동 기반으로 그룹화하고, 각각의 가족을 식별할 수 있어야 한다. 본 논문에서는 악성 소프트웨어를 회색조 이미지로 시각화함으로써, 전반적인 구조를 유지하면서 미세한 변화를 효과적으로 포착할 수 있다는 점을 활용한다. 동일 가족의 악성 샘플 간 시각적 유사성에 착안하여, 파일 형식에 구애받지 않는 딥러닝 기반의 악성 소프트웨어 분류 접근법을 제안한다. 이 방법은 이미지화된 악성 파일에서 추출한 구분 가능한 패턴들을 기반으로 악성 소프트웨어를 효율적으로 가족 단위로 그룹화한다. 제안한 방법의 타당성은 두 가지 벤치마크 데이터셋—MalImg 데이터셋과 Microsoft Malware Classification Challenge 데이터셋—을 대상으로 평가되었다. 실험적 비교 결과, 기존 최첨단 기법 대비 본 방법이 우수한 성능을 보임을 입증하였다.