이상 탐지를 위한 속성 복원 프레임워크

최근 딥 뉴럴 네트워크의 발전에 따라, 멀티미디어 분야에서 이상 탐지(alternative detection)는 컴퓨터 비전 분야에서 큰 주목을 받고 있다. 재구성 기반 방법은 최근 이상 탐지에 매우 유망한 성과를 보여주고 있으나, 재구성 작업에서 입력 데이터와 정답 레이블 간의 정보 동등성(information equivalence)은 네트워크가 의미론적 특징 임베딩(semantic feature embeddings)을 효과적으로 학습하도록 강제하지 못하는 한계가 있다. 본 연구에서는 이러한 동등성을 깨기 위해 원본 데이터에서 특정 속성(attribute)을 제거하고, 이를 복원(task)으로 재정의함으로써 문제를 해결한다. 이 경우, 정상 데이터와 이상 데이터는 복원 오차를 기반으로 구분될 수 있도록 기대된다. 네트워크가 원본 이미지를 복원하도록 강제함으로써, 제거된 속성과 관련된 의미론적 특징 임베딩이 학습된다. 테스트 단계에서는 이상 데이터가 정상 데이터로부터 학습된 속성 정보를 바탕으로 복원되므로, 복원 오차가 상대적으로 크게 나타날 것으로 기대된다. 다양한 실험을 통해 제안하는 방법이 여러 벤치마크 데이터셋에서 기존의 최상위 기법들을 크게 능가함을 입증하였으며, 특히 ImageNet에서는 최고 성능을 기록한 기존 기법의 AUROC를 10.1% 향상시켰다. 또한 본 방법은 실제 세계의 이상 탐지 데이터셋인 MVTec AD와 영상 이상 탐지 데이터셋인 ShanghaiTech에서도 평가되었으며, 우수한 성능을 보였다.