17일 전

DROCC: 딥 로버스트 원클래스 분류

Sachin Goyal, Aditi Raghunathan, Moksh Jain, Harsha Vardhan Simhadri, Prateek Jain
DROCC: 딥 로버스트 원클래스 분류
초록

일반적인 1-클래스 문제에 대한 전통적 접근 방식인 1-클래스 SVM과 이상 탐지 숲(Isolation Forest)은 이미지와 같은 구조화된 도메인에 적용할 경우 주의 깊은 특징 공학(feature engineering)이 필요하다. 최신 기법들은 딥러닝을 활용하여 적절한 특징을 학습하는 두 가지 주요 접근 방식을 제안한다. 첫 번째 접근 방식은 변환 예측을 기반으로 하는 것으로(Golan & El-Yaniv, 2018; Hendrycks et al., 2019a), 일부 도메인에서는 성공적이지만, 적절한 도메인 특화된 변환 집합에 크게 의존하며, 일반적으로 이러한 변환을 확보하는 것은 어렵다. 두 번째 접근 방식은 학습된 최종 레이어 표현에 대해 전통적인 1-클래스 손실을 최소화하는 방식으로, 예를 들어 DeepSVDD(Ruff et al., 2018)가 이에 해당한다. 그러나 이 방식은 표현 붕괴(representation collapse)라는 근본적인 단점에 직면한다. 본 연구에서는 어떤 보조 정보도 필요 없이 대부분의 표준 도메인에 적용 가능하며, 표현 붕괴에 대해 강건한 Deep Robust One-Class Classification(DROCC)를 제안한다. DROCC는 관심 있는 클래스의 점들이 잘 샘플링되고 국소적으로 선형적인 저차원 다양체(manifold) 위에 존재한다고 가정한다. 실증 평가를 통해 DROCC가 다양한 실제 데이터셋(표형 데이터, 이미지(CIFAR 및 ImageNet), 음성, 시계열 데이터 등)에 걸쳐 두 가지 다른 1-클래스 문제 설정에서 매우 효과적임을 입증하였으며, 이상 탐지 분야에서 최신 기법 대비 최대 20%의 정확도 향상을 제공한다. 코드는 https://github.com/microsoft/EdgeML 에서 제공된다.