
이미지 데이터에 대한 비지도 이상 탐지(unsupervised anomaly detection)는 전통적으로 안정성이 떨어지는 것으로 알려져 있다. 우리는 이 문제의 원인이 많은 전통적인 이상 탐지 기법이 데이터가 낮은 차원(low dimensional)에 있다고 암묵적으로 가정하기 때문이라고 믿는다. 그러나 이미지 데이터는 항상 높은 차원(high dimensional)에 위치한다. 이미지는 낮은 차원의 임베딩(embedding)으로 투영할 수는 있지만, 이러한 투영은 국소적인 변동을 무시하는 전역적 변환(global transformations)에 의존하게 되며, 미세한 변동은 대부분 소거된다. 이상 현상은 희귀하므로, 최종적으로 생성된 임베딩은 정상 샘플과 이상 샘플을 구분하는 데 필수적인 핵심적인 변동을 포함하지 못하는 경우가 많다. 본 논문에서는 국소적으로 변하는 데이터 투영의 집합을 활용한 새로운 임베딩 방법을 제안한다. 각각의 투영은 특정 지역 클러스터 내의 샘플들이 다른 모든 샘플들과 구분되는 변동을 유지하는 역할을 한다. 이러한 국소적 변동을 고려한 임베딩은 이상을 구분하는 데 중요한 변동을 보존할 뿐만 아니라, 해당 클러스터와 관련된 1차원 국소 투영을 통해 특정 샘플이 클러스터에 속할 확률을 통계적으로 추정할 수 있도록 한다. 이러한 클러스터 소속 확률들을 통계적으로 통합(agglomeration)함으로써, 샘플이 전체 데이터셋과의 유사도를 나타내는 글로벌 측도를 도출할 수 있으며, 이로 인해 이상 샘플은 예상보다 낮은 유사도 점수를 갖는 것으로 나타나게 된다.