15일 전
게이트형 완전 컨볼루션 네트워크를 이용한 재발 없이 제약 없는 손글씨 텍스트 인식
Denis Coquenet, Clément Chatelain, Thierry Paquet

초록
비제약(handwritten) 손글씨 인식은 대부분의 문서 분석 작업에서 중요한 단계이다. 일반적으로 이 작업은 깊은 순환 신경망(Deep Recurrent Neural Networks)을 사용하며, 특히 장기 기억 단기 기억(Long Short-Term Memory, LSTM) 셀을 활용한다. 이러한 구성 요소의 주요 단점은 학습 및 예측 시 병렬적으로 실행되지 않고 순차적으로 처리되어야 하며, 관련 파라미터 수가 매우 많다는 점이다. LSTM 셀을 사용하는 대안으로, 병렬 처리가 가능하고 파라미터 수가 적은 컨볼루션 층을 강하게 활용하여 장기 기억 손실을 보완하는 방안이 있다. 본 논문에서는 기존의 CNN+LSTM 아키텍처에 대한 순환 구조 없이 대체 가능한 게이트드 풀 컨볼루션 네트워크(Gated Fully Convolutional Network) 아키텍처를 제안한다. 제안한 모델은 CTC(Connectionist Temporal Classification) 손실 함수를 사용하여 훈련되었으며, RIMES 및 IAM 데이터셋에서 경쟁력 있는 성능을 보였다. 본 연구의 실험 재현을 위해 모든 코드를 공개한다. 코드는 다음 링크에서 확인할 수 있다: https://github.com/FactoDeepLearning/LinePytorchOCR.