2달 전
문서 이미지 분류를 위한 영역 내 전이 학습 및 깊은 합성곱 신경망의 스택된 일반화
Arindam Das; Saikat Roy; Ujjwal Bhattacharya; Swapan Kumar Parui

초록
이 연구에서는 문서 구조 학습을 위한 지역 기반 딥 컨볼루션 신경망(DCNN) 프레임워크를 제안합니다. 이 연구의 주요 공헌은 지역 기반 분류기의 효율적인 훈련과 문서 이미지 분류를 위한 효과적인 앙상블링에 있습니다. '인터 도메인' 전이 학습의 첫 번째 단계로, ImageNet 데이터셋에서 사전 훈련된 VGG16 아키텍처의 가중치를 내보내 전체 문서 이미지를 분류하는 모델을 훈련시키는 방법을 사용합니다. 지역 기반 영향 모델링의 특성을 활용하여, 두 번째 단계에서는 '인트라 도메인' 전이 학습을 사용하여 이미지 세그먼트에 대한 딥 러닝 모델의 빠른 훈련을 수행합니다. 마지막으로, 스택드 일반화 기반 앙상블링을 이용하여 기본 딥 신경망 모델들의 예측 결과를 결합합니다. 제안된 방법은 인기 있는 RVL-CDIP 문서 이미지 데이터셋에서 최고 수준의 정확도 92.2%를 달성하며, 기존 알고리즘들이 설정한 벤치마크를 초월하였습니다.