
초록
기계 학습의 긴 역사 속에서, 반복 신경망(RNN)은 주로 일차원 정보를 갖는 시계열 데이터 및 순차적 데이터 처리에 사용되어 왔다. 2차원 이미지에 관한 일부 드문 연구에서도 RNN은 이미지 인식 작업이 아니라 단순히 데이터를 순차적으로 학습하고 생성하는 데에만 활용되었다. 본 연구에서는 이미지 인식 모델 설계 시 RNN을 추가적인 레이어로 통합하는 새로운 접근 방식을 제안한다. 또한 여러 모델을 활용하여 전처리부터 출력까지 종단 간(end-to-end) 다중 모델 앙상블을 개발하여 전문가 수준의 예측을 생성한다. 더불어 학습 전략을 확장함으로써 제안 모델이 최첨단 모델과 경쟁할 수 있는 성능을 발휘할 뿐만 아니라, 여러 도전적인 데이터셋(예: SVHN(0.99), Cifar-100(0.9027), Cifar-10(0.9852))에서 최상위 수준의 성능을 달성한다. 또한 서리(Surrey) 데이터셋에서는 새로운 기록(0.949)을 수립하였다. 본 논문에서 제시하는 방법의 소스 코드는 https://github.com/leonlha/e2e-3m 및 http://nguyenhuuphong.me 에 공개되어 있다.