효율적인 픽셀 라벨링을 위한 산업 이상 감지 및 위치 결정

실제 이상 탐지(Anomaly Detection, AD) 작업에서 이상 픽셀의 수동 라벨링은 비용이 많이 드는 과정으로 입증되었습니다. 따라서 많은 AD 방법들이 비용 효율적인 접근 방식을 위해 이상이 전혀 포함되지 않은 훈련 세트를 대상으로 한 클래스 분류기로 설계되었습니다. 일부 선구적인 연구에서는 훈련에 실제 이상 샘플을 통합함으로써 AD 정확도가 크게 향상되는 것을 보여주었지만, 이 향상은 노동 집약적인 라벨링 프로세스의 비용을 필요로 합니다. 본 논문에서는 AD 정확도와 라벨링 비용 사이의 균형을 맞추기 위해 새로운 상호작용 이미지 분할(Interactive Image Segmentation, IIS) 알고리즘인 ADClick을 소개합니다. ADClick은 혁신적인 잔차 특성과 신중하게 설계된 언어 프롬프트를 활용하여 실제 결함 이미지에 대한 "Ground-truth" 이상 마스크를 효율적으로 생성합니다. 특히, ADClick은 기존 최첨단 IIS 접근 방식보다 현저히 높은 일반화 능력을 보여줍니다. 이상 라벨링 도구로서 ADClick은 각 훈련 이미지당 단 3~5회의 수동 클릭 주석만으로 MVTec AD에서 AP(Average Precision) 94.1%의 고품질 이상 라벨을 생성합니다. 또한, 우리는 ADClick의 기능을 확장하여 이상 탐지 및 위치 결정을 위한 개선된 모델인 ADClick-Seg를 제안합니다. ADClick이 추론한 약한 라벨을 사용하여 ADClick-Seg 모델을 미세 조정함으로써, 우리는 지도된 AD 작업에서 최첨단 성능(MVTec AD에서 AP 86.4%, KSDD2에서 AP 78.4%, PRO(Pixel-wise ROC AUC) 98.6%)을 달성하였습니다.