17일 전
AnomalyDINO: DINOv2를 활용한 패치 기반 소수 샘플 이상 탐지 성능 향상
Simon Damm, Mike Laszkiewicz, Johannes Lederer, Asja Fischer

초록
최근 다중모달 기반 모델의 발전은 소량 샘플 이상 탐지(한정된 샘플을 이용한 이상 탐지) 분야에서 새로운 기준을 설정하고 있다. 본 연구는 고품질의 시각적 특징만으로 기존 최첨단 시각-언어 모델과 경쟁할 수 있는지 여부를 탐구한다. 우리는 DINOv2 모델을 소량 및 한 번의 샘플을 이용한 이상 탐지에 적응함으로써 이 질문에 긍정적인 답을 제시한다. 특히 산업 응용을 중심으로 다루며, 제안하는 방법이 기존 기술과 경쟁할 뿐 아니라 많은 설정에서 이를 능가함을 보여준다. 본 연구에서 제안하는 시각 특징에 의존하는 단일 모델인 AnomalyDINO는 이미지 수준의 이상 예측과 픽셀 수준의 이상 세그멘테이션을 모두 가능하게 하는, 잘 정립된 패치 수준의 딥 최근접 이웃(Deep Nearest Neighbor) 패러다임을 따르고 있다. 이 방법은 방법론적으로 간단하며, 학습이 필요 없어 추가적인 데이터를 활용한 피팅(fine-tuning)이나 메타학습(meta-learning)이 필요하지 않다. 이러한 단순성에도 불구하고 AnomalyDINO는 소량 및 한 번의 샘플 이상 탐지에서 최첨단 성능을 달성한다(예: MVTec-AD 데이터셋에서 한 번의 샘플 성능을 AUROC 93.1%에서 96.6%로 향상). 낮은 계산 오버헤드와 뛰어난 소량 샘플 성능을 결합한 AnomalyDINO는 산업 현장 등에서 빠른 도입을 위한 강력한 후보 모델로 주목받고 있다.