비지도 이상 탐지를 위한 딥 오토인코딩 가우시안 혼합 모델

다양한 차원 또는 고차원 데이터에 대한 비지도 이상 탐지(unsupervised anomaly detection)는 기초 머신러닝 연구와 산업 응용 모두에서 매우 중요한 주제이며, 이는 밀도 추정(density estimation)에 기초한다. 기존의 차원 축소를 거친 후 밀도 추정을 수행하는 접근법들은 상당한 성과를 거두었지만, 주로 모델 학습이 분리되어 있으며 최적화 목표가 일관되지 않으며, 저차원 공간에서 핵심 정보를 충분히 보존하지 못하는 한계를 가지고 있다. 본 논문에서는 비지도 이상 탐지를 위한 심층 자동인코더 가우시안 혼합 모델(Depth Autoencoding Gaussian Mixture Model, DAGMM)을 제안한다. 본 모델은 심층 자동인코더를 활용하여 각 입력 데이터 포인트에 대해 저차원 표현과 재구성 오차(reconstruction error)를 생성한 후, 이를 가우시안 혼합 모델(Gaussian Mixture Model, GMM)에 입력한다. 기존의 분리된 두 단계 학습과 표준 기대값 최대화(Expectation-Maximization, EM) 알고리즘을 사용하는 방식과 달리, DAGMM은 심층 자동인코더와 혼합 모델의 파라미터를 종단 간(end-to-end)으로 동시에 공동 최적화한다. 이를 위해 별도의 추정 네트워크(estimation network)를 도입하여 혼합 모델의 파라미터 학습을 보조한다. 공동 최적화는 자동인코딩 재구성, 잠재 표현의 밀도 추정, 정규화를 잘 균형 있게 조화시켜, 자동인코더가 덜 유리한 국소 최적해(local optima)에 갇히는 것을 방지하고 재구성 오차를 추가로 감소시킨다. 이로 인해 사전 학습(pre-training)이 필요 없게 된다. 여러 공개 벤치마크 데이터셋에서의 실험 결과는 DAGMM이 최신 이상 탐지 기법들을 크게 능가하며, 표준 F1 점수 기준으로 최대 14%의 성능 향상을 달성함을 보여준다.