11일 전

다중 스케일 특징 재구성 네트워크를 활용한 산업 이상 탐지

{Yusra Abdulrahman, Yahya Zweiri, Brain Moyo, Sajid Javed, Samee Ullah Khan, Ehtesham Iqbal}
초록

비지도 이상 탐지 기법은 이상에 대한 사전 지식 없이 작동할 수 있어, 산업 검사 분야에서 적응성과 일반화 능력 측면에서 큰 주목을 받고 있다. 따라서 지식 기반 컴퓨터 비전 기법이 비정상적인 이미지 패턴을 식별하는 데 널리 활용되고 있다. 그러나 실시간 산업 응용에서는 이상 샘플의 제한, 결함에 대한 지식 부족, 복잡한 배경 질감 등의 도전 과제가 존재한다. 이러한 요인들은 결함 영역을 정확히 식별하는 데 어려움을 초래하며, 전통적인 오토인코더 네트워크는 이러한 문제를 극복하기 어려운 경우가 많다. 이러한 한계를 해결하기 위해, 본 연구에서는 도메인 시프트(Domain Shift) 상황에 특화된 다중 스케일 특징 재구성(Multi-Scale Feature Reconstruction, MSFR) 네트워크를 제안한다. 제안된 방법은 피라미드형 비전 트랜스포머 네트워크(Pyramidal Vision Transformer Network, PVTN)를 활용하여 다양한 스케일에서 구분 가능한 특징을 포착하는 다중 스케일 특징 맵을 재구성한다. 또한, 사전 훈련된 모듈을 통해 동일한 스케일에서 다수의 레벨 특징을 추출하고, 전용 특징 매칭 모듈을 통해 특징 간 정렬 확률을 향상시켜 정확도를 강화한다. MSFR 전략은 다중 깊이에서 픽셀 수준의 정보를 필터링함으로써 기존 오토인코더 기법을 뛰어넘는 성능을 발휘한다. 실험적 평가는 MVTec AD 및 AeBAD-S와 같은 벤치마크 데이터셋을 사용하여 수행되었으며, 광범위한 아블레이션 스터디를 통해 제안된 MSFR 방법의 효과성과 실용성을 입증하였다. 실험 결과, 제안된 모델은 최근의 다양한 접근법들보다 뚜렷하게 우수한 성능을 보였으며, 특히 제조 산업 분야의 실제 응용에 매우 적합함을 시사한다.

다중 스케일 특징 재구성 네트워크를 활용한 산업 이상 탐지 | 최신 연구 논문 | HyperAI초신경