3달 전

단일 이미지 내부의 내재적 노멀 프로토타입 탐색을 통한 유니버설 이상 탐지

Luo, Wei, Cao, Yunkang, Yao, Haiming, Zhang, Xiaotian, Lou, Jianan, Cheng, Yuqi, Shen, Weiming, Yu, Wenyong
단일 이미지 내부의 내재적 노멀 프로토타입 탐색을 통한 유니버설 이상 탐지
초록

이상 탐지(Anomaly Detection, AD)는 산업 검사에서 핵심적인 역할을 하지만, 기존의 방법들은 일반적으로 훈련 세트에서 얻은 정상 참조 이미지와 테스트 이미지를 "비교"하는 방식에 의존한다. 그러나 외관 및 위치의 변동성으로 인해 이러한 참조 이미지와 테스트 이미지 간의 정렬이 복잡해지며, 이는 탐지 정확도를 제한한다. 우리는 대부분의 이상이 국소적 변화로 나타남을 관찰하였으며, 이는 이상 이미지 내에서도 여전히 유용한 정상 정보가 존재함을 의미한다. 이러한 정보는 유용하며, 이상과 정상 정보 모두가 동일한 이미지에서 유래하므로 이상과 더 잘 일치할 가능성이 있다. 따라서 훈련 세트의 외부 정상성에 의존하는 기존 접근 방식을 벗어나, 테스트 이미지에서 직접 내재된 정상 프로토타입(Intrinsic Normal Prototypes, INPs)을 추출하는 새로운 방법인 INP-Former을 제안한다. 구체적으로, 정상 토큰들을 선형적으로 결합하여 INPs를 표현하는 INP 추출기(INP Extractor)를 도입하였으며, 테스트 이미지의 정상성을 충실하게 표현할 수 있도록 INP 일관성 손실(INP Coherence Loss)을 제안하였다. 이러한 INPs는 INP-가이드 디코더(INP-Guided Decoder)를 통해 정상 토큰만 재구성하도록 안내하며, 재구성 오차는 이상 점수로 활용된다. 또한, 학습 과정에서 처리가 어려운 샘플을 우선적으로 다루기 위해 소프트 마이닝 손실(Soft Mining Loss)을 제안하였다. INP-Former은 MVTec-AD, VisA, Real-IAD에서 단일 클래스, 다중 클래스, 소수 샘플(피셔트) AD 과제에서 최신 기술 수준의 성능을 달성하여, AD에 있어 유연하고 보편적인 솔루션으로 자리매김하였다. 특히 놀랍게도 INP-Former은 일부 제로샷(Zero-shot) AD 능력도 보여주었다. 코드는 다음 링크에서 제공된다: https://github.com/luow23/INP-Former.