2달 전

Dinomaly: 다중 클래스 비지도 이상 탐지에서 덜 사용할수록 더 좋은 철학

Guo, Jia ; Lu, Shuai ; Zhang, Weihang ; Chen, Fang ; Li, Huiqi ; Liao, Hongen
Dinomaly: 다중 클래스 비지도 이상 탐지에서 덜 사용할수록 더 좋은 철학
초록

최근 연구들은 다중 클래스 이미지를 위한 통합 모델을 구축하는 비지도 이상 탐지(Unsupervised Anomaly Detection, UAD)의 실제 적용 환경에 주목하고 있습니다. 이 어려운 과제를 해결하기 위한 다양한 발전이 이루어졌음에도 불구하고, 다중 클래스 환경에서의 탐지 성능은 여전히 최신 클래스 분리 모델보다 크게 뒤떨어져 있습니다. 본 연구는 이러한 성능 차이를 줄이는 것을 목표로 합니다. 본 논문에서는 복잡한 설계, 추가 모듈, 또는 특화된 기법에 의존하지 않고 순수한 Transformer 아키텍처를 활용한 최소주의적인 재구성 기반 이상 탐지 프레임워크인 Dinomaly를 소개합니다. 이 강력한 프레임워크는 Attention과 MLP만으로 구성되어 있으며, 우리는 다중 클래스 이상 탐지에 필수적인 네 가지 간단한 구성 요소를 발견했습니다: (1) 보편적이고 차별화된 특성을 추출하는 Foundation Transformers, (2) 기존 Dropout이 모든 노이즈 주입 기법을 수행하는 Noisy Bottleneck, (3) 자연스럽게 집중하지 않는 Linear Attention, (4) 층 간 및 점 간 재구성을 강제하지 않는 Loose Reconstruction입니다. MVTec-AD, VisA, Real-IAD 등 인기 있는 이상 탐지 벤치마크에서 광범위한 실험이 진행되었습니다. 제안된 Dinomaly는 세 데이터셋에서 각각 99.6%, 98.7%, 89.3%의 인상적인 이미지 수준 AUROC(Area Under the Receiver Operating Characteristic curve)를 달성하였으며, 이는 단순히 최신 다중 클래스 UAD 방법론보다 우수할 뿐 아니라 가장 선진적인 클래스 분리 UAD 기록도 달성하였습니다.