GeneralAD: 왜곡된 특징에 주목함으로써 도메인 간 이상 탐지

이상 탐지 분야에서 기존의 방법들은 일반적으로 고수준의 의미적 기준 또는 저수준의 산업적 기준에서 뛰어난 성능을 보이지만, 도메인 간 전이 능력은 흔히 부족하다. 의미적 이상(semantic anomalies)은 학습 데이터셋과 의미상 차이를 보이는 새로운 유형의 이상으로, 자율 주행 자동차에서 볼 수 없는 객체 등이 이에 해당한다. 반면 산업적 이상(industrial anomalies)은 의미적 구조를 유지하면서도 미세한 결함을 나타내는 것으로, 항공기 부품의 균열과 같은 사례가 있다. 본 논문에서는 최소한의 작업별 조정으로 의미적, 분포 근접(near-distribution), 산업적 환경 모두에서 효과적으로 작동할 수 있도록 설계된 이상 탐지 프레임워크인 GeneralAD를 제안한다. 제안하는 방법은 이미지 패치를 기반으로 학습되는 비전 트랜스포머(Visual Transformers)의 내재적 구조를 활용하며, 이로 인해 최종 은닉 상태가 패치 기반의 구조를 유지하게 된다. 우리는 간단한 연산(예: 노이즈 추가 및 패치 특징 셔플링)을 이용하여 가상의 이상 샘플을 생성하는 새로운 자기지도 학습 기반 이상 생성 모듈을 제안한다. 이러한 특징은 주의 기반 분류기(attention-based discriminator)에 입력되어 이미지 내 각 패치에 대해 이상 점수를 산출하도록 학습된다. 이를 통해 제안 방법은 이미지 수준에서 이상을 정확히 탐지할 뿐만 아니라, 해석 가능한 이상 맵(annotated anomaly maps)을 생성할 수 있다. 우리는 10개의 데이터셋에서 광범위한 실험을 수행하였으며, 이상 탐지 및 국소화(task) 모두에서 6개 데이터셋에서 최신 기준(SOTA) 성능을 달성하고, 나머지 데이터셋에서는 경쟁력 있는 성능을 보였다.