3달 전

SAM-LAD: 세그먼트 애피니어스 모델이 제로샷 논리 이상 탐지와 만난다

Yun Peng, Xiao Lin, Nachuan Ma, Jiayuan Du, Chuangwei Liu, Chengju Liu, Qijun Chen
SAM-LAD: 세그먼트 애피니어스 모델이 제로샷 논리 이상 탐지와 만난다
초록

시각적 이상 탐지는 산업적 결함 검출 및 의료 진단과 같은 실제 응용 분야에서 매우 중요하다. 그러나 기존 대부분의 방법들은 국소적인 구조적 이상에 초점을 맞추며, 논리적 조건 하에서 발생하는 고차원의 기능적 이상을 탐지하지 못하는 한계를 가지고 있다. 최근 연구들은 논리적 이상 탐지에 대해 탐색을 시도했지만, 주로 누락 또는 추가와 같은 단순한 이상에만 대응 가능하며, 데이터에 크게 의존하는 특성상 일반화 능력이 낮다. 이러한 격차를 보완하기 위해, 어떠한 시나리오에서도 적용 가능한 제로샷(zero-shot), 플러그 앤 플레이(Plug-and-Play) 형식의 논리적 이상 탐지 프레임워크인 SAM-LAD를 제안한다. 먼저, 사전 학습된 백본을 이용해 쿼리 이미지의 특징 맵을 추출한다. 동시에, 쿼리 이미지와 가장 유사한 이미지들(참조 이미지)과 그에 해당하는 특징 맵을 최근접 이웃 검색을 통해 검색한다. 다음으로, Segment Anything Model(SAM)을 활용하여 쿼리 이미지 및 참조 이미지의 객체 마스크를 추출한다. 각 객체 마스크를 전체 이미지의 특징 맵과 곱함으로써 객체 특징 맵을 생성한다. 이후, 쿼리 이미지와 참조 이미지 내 객체 간의 매칭을 수행하기 위한 객체 매칭 모델(Object Matching Model, OMM)을 제안한다. 객체 매칭을 보다 효과적으로 수행하기 위해, 각 객체를 핵심점(keypoint)으로 간주하고, 객체의 특징 맵을 특징 벡터로 변환하는 동적 채널 그래프 주의 메커니즘(Dynamic Channel Graph Attention, DCGA) 모듈을 추가로 제안한다. 마지막으로, 객체 간 매칭 관계를 기반으로 논리적 이상을 탐지하는 이상 측정 모델(Anomaly Measurement Model, AMM)을 제안한다. 본 모델은 객체 내 구조적 이상 또한 탐지할 수 있다. 제안한 SAM-LAD는 산업용 데이터셋(MVTec Loco AD, MVTec AD) 및 논리적 이상 데이터셋(DigitAnatomy)을 포함한 다양한 벤치마크를 통해 검증되었다. 광범위한 실험 결과를 통해 SAM-LAD가 기존 최고 성능(SoTA) 방법들을 상회함을 입증하였으며, 특히 논리적 이상 탐지에서 뛰어난 성능을 보였다.