17일 전

RADAM: 깊이 있는 활성화 맵의 무작위 집계 인코딩을 통한 텍스처 인식

Leonardo Scabini, Kallil M. Zielinski, Lucas C. Ribas, Wesley N. Gonçalves, Bernard De Baets, Odemir M. Bruno
RADAM: 깊이 있는 활성화 맵의 무작위 집계 인코딩을 통한 텍스처 인식
초록

텍스처 분석은 딥 신경망이 적극적으로 적용되고 있는 컴퓨터 비전 분야에서 전통적이면서도 도전적인 과제이다. 대부분의 기존 접근법은 사전 훈련된 백본(Backbone) 주변에 특징 집계 모듈을 구축한 후, 특정 텍스처 인식 작업에 대해 새로운 아키텍처를 미세 조정하는 방식이다. 본 연구에서는 사전 훈련된 백본의 구조를 전혀 변경하지 않고도 풍부한 텍스처 표현을 추출할 수 있는 새로운 방법을 제안한다. 이를 위해 \textbf{R}andom encoding of \textbf{A}ggregated \textbf{D}eep \textbf{A}ctivation \textbf{M}aps (RADAM)라는 기법을 도입한다. RADAM은 사전 훈련된 심층 합성곱 신경망의 다양한 깊이에서 출력된 특징 맵을 무작위 오토인코더(Randomized Autoencoder, RAE)를 사용하여 인코딩한다. RAE는 각 이미지에 대해 폐쇄형 해를 이용해 로컬하게 훈련되며, 디코더 가중치를 활용하여 1차원 텍스처 표현을 구성한다. 이 표현은 선형 SVM에 입력된다. 따라서 미세 조정이나 역전파(backpropagation) 과정이 필요하지 않다. 다양한 텍스처 벤치마크에서 RADAM을 평가한 결과, 다양한 계산 자원 제약 조건 하에서도 최신 기술 수준의 성능을 달성하였다. 본 연구 결과는 사전 훈련된 백본의 학습된 표현이 더 효과적으로 인코딩된다면, 텍스처 인식 작업을 위해 추가적인 미세 조정이 필요하지 않을 수 있음을 시사한다.