2달 전

다중 클래스 비지도 이상 탐지용 계층적 벡터 양자화 변환기

Lu, Ruiying ; Wu, YuJie ; Tian, Long ; Wang, Dongsheng ; Chen, Bo ; Liu, Xiyang ; Hu, Ruimin
다중 클래스 비지도 이상 탐지용 계층적 벡터 양자화 변환기
초록

비지도 이미지 이상 탐지(Unsupervised Image Anomaly Detection, UAD)는 정상 샘플의 강력하고 구분력 있는 표현을 학습하는 것을 목표로 합니다. 클래스별로 별도의 솔루션을 적용하면 비용이 많이 들고 일반화 능력이 제한적이기 때문에, 이 논문은 여러 클래스를 위한 통합 프레임워크 구축에 초점을 맞춥니다. 이러한 도전적인 환경에서, 연속적인 잠재 표현 가정을 기반으로 하는 인기 있는 재구성 기반 네트워크들은 항상 "동일한 단축" 문제에 직면합니다. 이 문제는 정상 샘플과 비정상 샘플 모두 잘 재구성되어 구분하기 어려운 상황을 의미합니다. 이 중요한 문제를 해결하기 위해, 우리는 확률적 프레임워크 하에서 계층적 벡터 양자화된 프로토타입 지향 트랜스포머를 제안합니다.첫째, 연속적인 표현을 학습하는 대신, 우리는 정상 패턴의 전형적인 특성을 이산화된 아이콘 프로토타입으로 보존하고, 모델이 단축에 빠지는 것을 방지하는 데 벡터 양자화(Vector Quantization)의 중요성을 확인합니다. 벡터 양자화된 아이콘 프로토타입은 트랜스포머에 통합되어 재구성 과정에서 비정상 데이터 포인트가 정상 데이터 포인트로 변환되도록 합니다.둘째, 우리는 코드북 붕괴 문제를 완화하고 약한 정상 패턴을 보충하기 위한 섬세한 계층적 프레임워크를 연구합니다.셋째, 프로토타입 지향 최적 운송 방법(Optimal Transport Method)을 제안하여 프로토타입을 더 효과적으로 규제하고 계층적으로 비정상 점수를 평가할 수 있도록 합니다. MVTec-AD와 VisA 데이터셋에서 평가한 결과, 우리의 모델은 최신 대안들을 능가하며 좋은 해석 가능성을 갖추고 있습니다. 코드는 https://github.com/RuiyingLu/HVQ-Trans에서 이용할 수 있습니다.