17일 전
VT-ADL: 이미지 이상 탐지 및 국소화를 위한 비전 트랜스포머 네트워크
Pankaj Mishra, Riccardo Verk, Daniele Fornasier, Claudio Piciarelli, Gian Luca Foresti

초록
우리는 재구성 기반 접근법과 패치 임베딩을 결합한 트랜스포머 기반 이미지 이상 탐지 및 국지화 네트워크를 제안한다. 제안한 모델은 트랜스포머 네트워크를 활용하여 임베딩된 패치의 공간 정보를 효과적으로 유지하며, 이후 가우시안 혼합 밀도 네트워크(Gaussian mixture density network)를 통해 이상 영역을 정확히 국지화한다. 또한, 실제 산업 환경에서의 이상 데이터를 포함하는 BTAD라는 새로운 산업용 이상 데이터셋도 공개한다. 제안한 방법의 성능은 MNIST 및 MVTec과 같은 공개된 데이터셋을 이용해 다른 최신 알고리즘과 비교하여 평가하였다.