15일 전
Start, Follow, Read: 엔드투엔드 전체 페이지 손글씨 인식
{Brian Davis, Brian Price, Chris Tensmeyer, William Barrett, Scott Cohen, Curtis Wigington}

초록
수십 년에 걸친 연구에도 불구하고, 훼손된 역사적 문서에 대한 오프라인 손글씨 인식(HWR)은 여전히 도전적인 문제로 남아 있으며, 이 문제가 해결된다면 온라인 문화유산 아카이브의 검색 가능성이 크게 향상될 수 있다. 일반적으로 HWR 모델은 텍스트 탐지 및 분할 단계의 정확도에 제한을 받는다. 이러한 문제를 해결하고자, 본 연구에서는 탐지 및 분할 레이블이 거의 필요 없는 이미지 데이터를 주로 사용하여 텍스트 탐지, 분할, 인식을 함께 학습하는 딥러닝 모델을 제안한다. 제안하는 SFR(Start, Follow, Read) 모델은 텍스트 줄의 시작 위치를 탐지하는 영역 제안 네트워크와, 곡선일 수 있는 텍스트 줄을 단계적으로 따라가며 전처리하여 CNN-LSTM 네트워크가 인식하기 적합한 평면화된 이미지로 변환하는 새로운 선 추적 네트워크로 구성되어 있다. SFR 모델은 ICDAR2017 손글씨 인식 경쟁 대회 우승자 모델을 초과하는 성능을 보였으며, 제공된 경쟁용 영역 레이블을 사용하지 않은 경우에도 그 성능이 유지된다.