
초록
복원 기반의 이상 탐지 접근법은 타겟 클래스 간의 상대적으로 높은 클래스 간 분산을 가진 복잡한 데이터셋에 적용될 경우 성능이 저하되는 경향이 있다. 전이 학습에서 사용되는 자기 학습(self-taught learning) 개념과 유사하게, 많은 분야에서 유사한 레이블이 없는 데이터셋이 풍부하게 존재하며, 이러한 데이터는 분포 외 샘플(out-of-distribution samples)의 대체 자료로 활용될 수 있다. 본 논문에서는 유사한 도메인에서 얻은 레이블이 없는 데이터를 음성 예시(negative examples)로 활용하여 일반적인 오토인코더의 잠재층(bottleneck)을 조정하는 잠재적 불변 오토인코더(Latent-Insensitive autoencoder, LIS-AE)를 제안한다. 이를 통해 잠재층은 오직 하나의 작업에만 복원이 가능하도록 제한된다. 제안된 학습 과정과 손실 함수에 대한 이론적 근거를 제시하며, 모델의 핵심 요소들을 강조하는 광범위한 제거 실험(ablation study)을 수행하였다. 다양한 이상 탐지 설정에서 제안 모델을 검증하여 정량적 및 정성적 분석을 통해 이상 탐지 작업에서 본 모델이 나타내는 뚜렷한 성능 향상을 입증하였다.