17일 전

LR-Net: 저해상도 이미지 분류를 위한 �ブロック 기반 컨볼루션 신경망

Ashkan Ganj, Mohsen Ebadpour, Mahdi Darvish, Hamid Bahador
LR-Net: 저해상도 이미지 분류를 위한 �ブロック 기반 컨볼루션 신경망
초록

CNN 기반 아키텍처가 이미지 분류 작업에서 특징 학습 및 추출에 성공함으로써 최근들어 매우 인기를 끌고 있지만, 최첨단 모델을 노이지가 많고 품질이 낮은 이미지 분류에 적용할 경우 이 작업은 더욱 도전적으로 변한다. 이러한 이미지의 해상도가 낮고 의미 있는 전역적 특징이 부족하기 때문에 모델이 유의미한 특징을 추출하는 데 여전히 어려움이 있다. 더불어 고해상도 이미지를 처리하기 위해서는 더 많은 층을 가진 네트워크를 학습시켜야 하므로, 학습에 소요되는 시간과 계산 자원이 증가하게 된다. 본 연구에서는 앞서 언급한 깊은 신경망에서 층이 깊어질수록 발생하는 기울기 소실(gradient vanishing) 문제도 동시에 해결하고자 하였다. 이러한 문제들을 종합적으로 해결하기 위해, 흐릿하고 노이지가 많은 저해상도 이미지로부터 저수준 특징과 전역적 특징을 동시에 학습할 수 있도록 설계된 블록들로 구성된 새로운 이미지 분류 아키텍처를 제안하였다. 본 연구에서 제안하는 블록의 설계는 성능 향상과 파라미터 수 감소를 위해 리저벌 연결(Residual Connections)과 인셉션 모듈(Inception modules)의 아이디어를 적극적으로 활용하였다. 또한, 특히 노이지가 많고 품질이 낮아 분류가 가장 어려운 오라클-MNIST(Oracle-MNIST) 데이터셋을 포함한 MNIST 계열 데이터셋을 활용하여 제안한 모델의 성능을 평가하였다. 심층적인 실험을 통해 제안된 아키텍처가 기존 최첨단 컨볼루션 신경망보다 빠르고 정확함을 입증하였다. 게다가 본 모델의 독특한 특성으로 인해, 더 적은 파라미터로도 우수한 성능을 달성할 수 있음을 확인하였다.