17일 전

스택믹스 및 블롯 증강 기법을 활용한 수기 텍스트 인식

Alex Shonenkov, Denis Karachev, Maxim Novopoltsev, Mark Potanin, Denis Dimitrov
스택믹스 및 블롯 증강 기법을 활용한 수기 텍스트 인식
초록

이 논문은 현재 최고 수준의 기술을 능가하는 손글씨 텍스트 인식(HTR) 시스템을 제안한다. 비교 실험은 HTR 작업에서 가장 널리 사용되는 세 가지 데이터셋—Ben-tham, IAM, Saint Gall—을 대상으로 수행되었으며, 최근 발표된 두 가지 데이터셋인 Peter the Great's manuscripts 및 HKR Dataset에 대한 결과도 제공한다. 논문은 신경망 아키텍처를 설명하고, 학습 데이터 양을 증가시키는 두 가지 방법을 제시한다. 첫 번째는 횡선(스트라이크스루) 텍스트를 시뮬레이션하는 증강 기법(Handwritten Blots), 두 번째는 HTR 작업에서 매우 효과적인 것으로 입증된 새로운 텍스트 생성 방법(StackMix)이다. StackMix는 인쇄체 텍스트를 기반으로 손글씨 텍스트를 생성하는 독립적인 작업에도 적용 가능하다.