2달 전

문서 이미지 분류를 위한 컨볼루션 신경망 분석

Chris Tensmeyer; Tony Martinez
문서 이미지 분류를 위한 컨볼루션 신경망 분석
초록

컨벌루션 신경망(CNNs)은 문서 이미지 분류 작업에서 최첨단 모델입니다. 그러나 이러한 접근 방식의 대부분은 자연 이미지를 분류하기 위해 설계된 매개변수와 아키텍처에 의존하고 있으며, 이는 문서 이미지와 다르다는 점을 고려해야 합니다. 우리는 이러한 접근 방식이 적절한지 의문을 제기하며, 문서 이미지 분류 성능에 가장 큰 영향을 미치는 CNN의 측면을 찾아내기 위해 대규모 실증 연구를 수행했습니다. 그 결과, 시어 변환 데이터 증강(shear transform data augmentation)과 더 큰 입력 이미지를 위한 아키텍처를 사용하여 RVL-CDIP 데이터셋에서 기존 최고 수준의 성능을 초월하였습니다. 또한 학습된 특성을 분석한 결과, RVL-CDIP에서 훈련된 CNN이 지역별 레이아웃 특성을 학습한다는 증거를 발견하였습니다.

문서 이미지 분류를 위한 컨볼루션 신경망 분석 | 최신 연구 논문 | HyperAI초신경