DiAD: 다중 클래스 이상 탐지에 대한 확산 기반 프레임워크

재구성 기반 접근법은 이상 탐지 분야에서 뛰어난 성과를 거두었습니다. 최근 인기 있는 확산 모델의 우수한 이미지 재구성 능력은 이들을 이용하여 이상 이미지를 더욱 효과적으로 재구성하기 위한 연구 노력들을 촉발시켰습니다. 그럼에도 불구하고, 이러한 방법들은 실제적인 다중 클래스 환경에서 이미지 카테고리와 픽셀 단위 구조적 무결성을 유지하는 데 관련된 문제에 직면할 수 있습니다. 위 문제들을 해결하기 위해, 우리는 다중 클래스 이상 탐지를 위한 확산 기반 이상 탐지(DiAD) 프레임워크를 제안합니다. 이 프레임워크는 픽셀 공간 오토인코더, 잠재 공간에서 안정적인 확산의 디노이징 네트워크와 연결된 의미 지도(Semantic-Guided, SG) 네트워크, 그리고 특징 공간의 사전 학습된 특징 추출기로 구성됩니다.첫째, SG 네트워크는 원본 이미지의 의미 정보를 유지하면서 이상 영역을 재구성하도록 제안되었습니다. 둘째, 광범위하게 재구성된 영역을 처리할 때 재구성 정확도를 최대화하기 위해 공간 인식 특징 융합(Spatial-aware Feature Fusion, SFF) 블록을 도입하였습니다. 셋째, 입력 이미지와 재구성된 이미지는 서로 다른 스케일에서 추출된 특징을 바탕으로 이상 맵을 생성하기 위해 사전 학습된 특징 추출기를 통해 처리됩니다.MVTec-AD 및 VisA 데이터셋에서 수행한 실험 결과는 우리의 접근법이 최신 기술보다 우수함을 입증하였습니다. 예를 들어, 다중 클래스 MVTec-AD 데이터셋에서 위치 결정(locatization)과 탐지(detection)에 대해 각각 96.8/52.6 및 97.2/99.0 (AUROC/AP)의 성능을 달성하였습니다. 코드는 https://lewandofskee.github.io/projects/diad 에서 제공될 예정입니다.