MuSc: 레이블링되지 않은 이미지의 상호 점수화를 통한 제로샷 산업 이상 분류 및 세그멘테이션

이 논문은 산업 영상에서의 제로샷 이상 탐지 분류(AC) 및 세그멘테이션(AS)을 연구한다. 기존 방법들이 간과한 바와 같이, 레이블이 없는 테스트 이미지 내에 포함된 풍부한 정상 및 비정상적 신호를 활용하여 이상 여부를 판단할 수 있음을 밝히고 있다. 본 연구의 핵심 관찰은 산업 제품 이미지의 경우, 정상 이미지 패치는 다른 레이블이 없는 이미지들 내에서 상대적으로 많은 유사 패치를 찾을 수 있지만, 비정상 패치는 유사 패치가 거의 존재하지 않는다는 점이다. 이러한 구분 가능한 특성을 활용하여, 학습이나 프롬프트 없이도 작동하는 새로운 제로샷 AC/AS 방법인 상호 점수화(MuSc)를 제안한다. 구체적으로, 다양한 크기의 이상을 표현할 수 있는 패치 특징을 얻기 위해 다중 정도의 국소 근접 집계(Local Neighborhood Aggregation with Multiple Degrees, LNAMD)를 수행한다. 이후, 레이블이 없는 테스트 이미지 간에 상호 점수화 메커니즘(Mutual Scoring Mechanism, MSM)을 도입하여 각 이미지에 대해 이상 점수를 부여한다. 또한, 정상 이미지 내 노이즈로 인한 오류 양성(false positive)을 억제하기 위해 이미지 수준 이상 분류를 개선하기 위한 최적화 방법인 제한된 이미지 수준 근접성 기반 재점수화(RsCIN)를 제안한다. 도전적인 MVTec AD 및 VisA 데이터셋에서 우수한 성능을 입증하며, 최신 제로샷 방법들과 비교하여 MVTec AD에서 PRO 지표에 21.1% 절대 향상(72.7% → 93.8%)을 달성하였고, VisA에서는 픽셀 기준 AP 지표에 19.4%, AUROC 지표에 14.7% 향상하였다. 또한, 제안한 제로샷 접근법은 대부분의 소수 샘플(few-shot) 방법보다 뛰어난 성능을 보이며, 일부 원클래스(one-class) 방법과도 유사한 수준을 달성하였다. 코드는 https://github.com/xrli-U/MuSc 에서 공개되어 있다.