주의 유도 이미지 이상 탐지

이상 탐지 지역화는 산업 검사, 감시 및 의료 영상 등 다양한 분야에 응용되는 컴퓨터 비전 분야에서 중요한 문제로, 이미지 내 이상 영역을 정확히 식별하는 것을 목표로 한다. 그러나 현실 세계의 시나리오에서는 이상 영역의 샘플 수가 매우 적고, 픽셀 커버리지가 작기 때문에 이 작업은 큰 도전 과제이다. 기존 대부분의 연구들은 이상 이미지를 사용하여 특정 클래스에 맞는 임계값을 계산함으로써 이상을 지역화하는 방식을 채택하고 있다. 본 연구에서는 이상 훈련 이미지를 필요로 하지 않는 새로운 접근법인 '안내 주의를 갖춘 컨볼루셔널 적대적 변분 오토인코더(Convolutional Adversarial Variational autoencoder with Guided Attention, CAVGA)'를 제안한다. 이 모델은 공간 정보를 보존하기 위해 컨볼루셔널 잠재 변수를 사용하여 이상 영역을 효과적으로 탐지한다. 비감독 학습 설정에서는, CAVGA가 이미지 내 모든 정상 영역에 집중하도록 유도하는 '주의 확장 손실(attention expansion loss)'을 제안한다. 또한 약한 감독 설정에서는, 정상 영역에 주의를 집중시키면서 동시에 이상 영역에 해당하는 주의 맵을 최소화하도록 유도하는 '보완적 안내 주의 손실(complementary guided attention loss)'을 도입한다. 실험 결과, CAVGA는 비감독 설정에서 MVTec 이상 탐지(MVTec Anomaly Detection, MVTAD), 개조된 샤먼테크 캠퍼스(modified ShanghaiTech Campus, mSTC), 대규모 주의 기반 녹내장(Large-scale Attention based Glaucoma, LAG) 데이터셋에서 최신 기술(SOTA) 이상 지역화 방법들을 모두 상회하며, 약한 감독 설정에서 단 2%의 이상 이미지만 사용하는 조건에서도 뛰어난 성능을 보였다. 또한 MNIST, CIFAR-10, Fashion-MNIST, MVTAD, mSTC, LAG 데이터셋에서 SOTA 이상 탐지 방법들보다도 우수한 성능을 달성하였다.