Command Palette
Search for a command to run...
{Cristian Lumezanu Wei Cheng Qi Song Daeki Cho Bo Zong Martin Renqiang Min Haifeng Chen}

초록
다양한 차원 또는 고차원 데이터에 대한 비지도 이상 탐지(unsupervised anomaly detection)는 기초 머신러닝 연구와 산업 응용 모두에서 매우 중요한 주제이며, 이는 밀도 추정(density estimation)에 기초한다. 기존의 차원 축소를 거친 후 밀도 추정을 수행하는 접근법들은 상당한 성과를 거두었지만, 주로 모델 학습이 분리되어 있으며 최적화 목표가 일관되지 않으며, 저차원 공간에서 핵심 정보를 충분히 보존하지 못하는 한계를 가지고 있다. 본 논문에서는 비지도 이상 탐지를 위한 심층 자동인코더 가우시안 혼합 모델(Depth Autoencoding Gaussian Mixture Model, DAGMM)을 제안한다. 본 모델은 심층 자동인코더를 활용하여 각 입력 데이터 포인트에 대해 저차원 표현과 재구성 오차(reconstruction error)를 생성한 후, 이를 가우시안 혼합 모델(Gaussian Mixture Model, GMM)에 입력한다. 기존의 분리된 두 단계 학습과 표준 기대값 최대화(Expectation-Maximization, EM) 알고리즘을 사용하는 방식과 달리, DAGMM은 심층 자동인코더와 혼합 모델의 파라미터를 종단 간(end-to-end)으로 동시에 공동 최적화한다. 이를 위해 별도의 추정 네트워크(estimation network)를 도입하여 혼합 모델의 파라미터 학습을 보조한다. 공동 최적화는 자동인코딩 재구성, 잠재 표현의 밀도 추정, 정규화를 잘 균형 있게 조화시켜, 자동인코더가 덜 유리한 국소 최적해(local optima)에 갇히는 것을 방지하고 재구성 오차를 추가로 감소시킨다. 이로 인해 사전 학습(pre-training)이 필요 없게 된다. 여러 공개 벤치마크 데이터셋에서의 실험 결과는 DAGMM이 최신 이상 탐지 기법들을 크게 능가하며, 표준 F1 점수 기준으로 최대 14%의 성능 향상을 달성함을 보여준다.