12일 전

이소레이션 포레스트

{Zhi-Hua Zhou, Kai Ming Ting, Fei Tony Liu}
초록

기존의 대부분의 모델 기반 이상 탐지 방법은 정상적인 인스턴스의 프로파일을 구축한 후, 이 정상 프로파일에 부합하지 않는 인스턴스를 이상치로 식별한다. 본 논문에서는 기존의 정상 포인트를 프로파일링하는 방식과는 근본적으로 다른 모델 기반 접근법을 제안한다. 이 방법은 정상 포인트를 프로파일링하는 대신, 이상치를 명시적으로 고립하는 방식을 채택한다. 현재의 문헌에서 고립(isolation) 개념이 탐색된 바는 본 연구를 포함해 알려진 바가 없다. 고립을 활용함으로써 제안하는 알고리즘인 iForest는 기존 방법에서는 실현 불가능한 수준까지 서브샘플링을 활용할 수 있게 되어, 낮은 상수를 가지며 선형 시간 복잡도와 낮은 메모리 요구량을 갖는 알고리즘을 구현할 수 있게 되었다. 실증 평가 결과, iForest는 AUC 및 처리 시간 측면에서 ORCA(근사 선형 시간 복잡도의 거리 기반 방법), LOF, Random Forests와 비교하여 우수한 성능을 보였으며, 특히 대용량 데이터셋에서 두드러진 성능을 나타냈다. 또한, 관련성이 낮은 특성(attribute)이 매우 많은 고차원 문제 상황에서도 우수한 성능을 발휘하며, 학습 데이터셋에 이상치가 전혀 포함되지 않은 경우에도 효과적으로 작동함을 확인할 수 있었다.

이소레이션 포레스트 | 최신 연구 논문 | HyperAI초신경