Kuzushiji-MNIST 벤치마크 데이터셋 분류를 위한 개선된 효율적인 캡슐 네트워크
본 논문에서는 Kuzushiji-MNIST 및 Kuzushiji-49 기준 데이터셋에 대한 분류를 위한 개선된 효율적인 캡슐 네트워크(CN) 모델을 제안한다. 캡슐 네트워크는 기존의 합성곱 신경망(CNN)에 비해 강건성, 더 나은 일반화 능력, 간단한 네트워크 구조 등의 장점을 지닌 딥러닝 분야에서 주목받는 전망 있는 접근 방식이다. 본 연구에서 제안한 모델은 효율적인 캡슐 네트워크(Efficient CapsNet) 아키텍처를 기반으로 하며, 자기 주의(self-attention) 라우팅 메커니즘을 도입함으로써 효율성 향상과 파라미터 수 감소를 달성하였다. Kuzushiji-MNIST 및 Kuzushiji-49 데이터셋에서 수행한 실험 결과, 제안 모델은 두 기준 데이터셋 모두에서 상위 10위 내의 경쟁력 있는 성능을 보였다. 특히, 더 높은 평가를 받은 경쟁 모델들에 비해 훨씬 적은 파라미터를 사용하면서도 정확도는 유사한 수준을 달성하였으며, Kuzushiji-MNIST 및 Kuzushiji-49 데이터셋에 대해 각각 0.91%, 1.97%의 미미한 정확도 차이만을 보였다. 더불어 이러한 성능을 달성하기 위한 학습 시간도 상당히 단축되어 전용 워크스테이션 없이도 일반적인 컴퓨터 환경에서 학습이 가능하게 되었다. 캡슐 아키텍처의 본 연구에서 제안한 새로운 특징들인 자기 주의 메커니즘의 통합 및 효율적인 네트워크 구조 설계는 제안 모델의 효율성과 성능 향상에 기여하였다. 이러한 결과는 캡슐 네트워크가 문자 분류 과제에 있어 더 효율적이고 효과적인 접근 방식으로서의 잠재력을 보여주며, 다양한 분야에 걸쳐 광범위한 응용 가능성을 시사한다.