
본 논문에서는 시각적 이상 탐지(visual anomaly detection)를 위한 새로운 최첨단 기반 프레임워크인 이중 주의 메커니즘을 갖춘 트랜스포머 및 구분형 흐름(Dual-attention Transformer and Discriminative Flow, DADF)을 제안한다. 정상(normal) 데이터만을 기반으로 하는 시각적 이상 탐지는 산업 현장에서 넓은 응용 가능성을 지니며, 최근 많은 주목을 받고 있다. 그러나 기존 대부분의 방법들은 이러한 요구사항을 충족하지 못하고 있다. 반면, 제안하는 DADF는 새로운 패러다임을 제시한다. 먼저 사전 훈련된 네트워크를 활용하여 다중 해상도의 사전 지식 임베딩(prior embeddings)을 추출하고, 이후 이중 주의 메커니즘(자기 주의 self-attention 및 기억 주의 memorial-attention)을 갖춘 비전 트랜스포머를 설계하여, 사전 지식 임베딩에 대해 순차적이고 정상성과 관련된 이중 수준의 재구성(reconstruction)을 수행한다. 또한 각 해상도에서 사전 지식과 재구성의 결합 분포에 대해 구분형 가능도(discriminative likelihood)를 설정하기 위해 정규화 흐름(normalizing flow)을 도입한다. 제안한 DADF는 Mvtec AD 기준에서 이미지 및 픽셀 AUROC가 각각 98.3, 98.4를 기록하였으며, Mvtec LOCO AD 벤치마크에서는 이미지 AUROC 83.7, 픽셀 sPRO 67.4를 달성하여 본 연구의 효과성을 입증하였다.