사격 전 타겟: 계단식 패치 검색을 통한 1밀리초 이내 정확한 이상 탐지 및 위치 결정

이 연구에서는 이상 탐지(Anomaly Detection, AD)의 '매칭(matching)' 특성을 재검토함으로써, AD 정확도에서 새로운 기록을 달성하면서도 매우 높은 실행 속도를 동시에 확보할 수 있는 새로운 AD 프레임워크를 제안한다. 본 프레임워크에서는 각 테스트 이미지 패치에 대해 거친 단계에서 세밀한 단계로 나아가는 계단식 패치 검색 절차를 통해 이상 탐지 문제를 해결한다. 테스트 샘플이 주어지면, 강건한 히스토그램 매칭 과정을 기반으로 가장 유사한 상위 K개의 학습 이미지를 먼저 선택한다. 이후, 이들 '글로벌 근접 이미지'의 유사한 기하학적 위치에서, 철저히 학습된 국소적 거리 측정 기준을 사용하여 각 테스트 패치의 가장 가까운 이웃을 검색한다. 마지막으로, 각 테스트 이미지 패치의 이상 점수는 해당 패치의 '국소 근접 이웃'과의 거리 및 '배경이 아닌' 확률에 기반하여 계산된다. 본 연구에서 제안하는 방법은 이 작업에서 '계단식 패치 검색(Cascade Patch Retrieval, CPR)'이라 명명한다. 기존의 패치 매칭 기반 AD 알고리즘과 달리, CPR은 '사격(shooting, 패치 매칭)'에 앞서 적절한 '대상(target)'(참조 이미지 및 위치)을 선택한다. 잘 알려진 MVTec AD, BTAD, MVTec-3D AD 데이터셋에서, 다양한 AD 평가 지표를 기준으로 제안된 알고리즘이 모든 비교 대상 최첨단(SOTA) 방법들을 뚜렷한 격차로 압도적으로 상회한다. 더불어 CPR은 매우 효율적이다. 표준 설정 하에서 113 FPS의 속도로 실행되며, 간소화된 버전은 정확도가 미미하게 저하되는 대가로 이미지 하나를 처리하는 데 1ms 미만의 시간만 소요된다. CPR의 코드는 https://github.com/flyinghu123/CPR 에서 공개되어 있다.