
초록
비제약적인 엔드투엔드 텍스트 로컬라이제이션 및 인식 방법이 제안된다. 이 방법은 효율적인 영역 기반 기법을 통해 단일 패스로 초기 텍스트 가설을 탐지한 후, 더 강력한 국소 텍스트 모델을 사용하여 텍스트 가설을 보정한다. 이는 기존 영역 기반 방법이 모든 문자를 연결 요소로 탐지한다는 일반적인 가정과는 다릅니다. 또한, 문자 획 면적 추정을 기반으로 한 새로운 특징이 도입된다. 이 특징은 영역 거리 맵에서 효율적으로 계산되며, 스케일링과 회전에 대해 불변성을 가지며, 텍스트 영역이 포함하는 텍스트의 부분에 관계없이 효율적으로 텍스트 영역을 탐지할 수 있다. 제안된 방법은 실시간으로 작동하며, ICDAR 2013 Robust Reading 데이터셋에서 최신 기술 수준의 텍스트 로컬라이제이션 및 인식 성능을 달성한다.