17일 전
SPAN: 손글씨 단락 인식을 위한 간단한 예측 및 정렬 네트워크
Denis Coquenet, Clément Chatelain, Thierry Paquet

초록
비제약적 손글씨 인식은 문서 분석에서 핵심적인 과제이다. 일반적으로 두 단계로 수행된다. 먼저 문서를 텍스트 줄 단위로 분할하고, 이후 각 줄 이미지에 광학 문자 인식(OCR) 모델을 적용한다. 본 연구에서는 단순 예측 및 정렬 네트워크(Simple Predict & Align Network, SPAN)를 제안한다. 이는 전단계의 분할 과정 없이 단락 수준에서 OCR을 수행하는 엔드투엔드 비반복형 완전 컨볼루션 네트워크이다. 제안된 프레임워크는 고립된 텍스트 줄 인식에 사용되는 것과 동일한 정도로 간단하며, RIMES, IAM, READ 2016 세 가지 주요 데이터셋에서 경쟁력 있는 성능을 달성하였다. 제안 모델은 데이터셋 적응이 필요 없으며, 분할 레이블 없이 초기 상태에서 학습이 가능하고, 전사 레이블에 줄 바꿈 정보도 필요로 하지 않는다. 코드 및 학습된 모델 가중치는 https://github.com/FactoDeepLearning/SPAN 에서 공개되어 있다.