2달 전

표시, 주의 집중 및 읽기: 불규칙한 텍스트 인식을 위한 간단하고 강력한 기준선

Li, Hui ; Wang, Peng ; Shen, Chunhua ; Zhang, Guyu
표시, 주의 집중 및 읽기: 불규칙한 텍스트 인식을 위한 간단하고 강력한 기준선
초록

자연 환경 이미지에서 불규칙한 텍스트를 인식하는 것은 곡률, 방향, 왜곡 등의 텍스트 표현에 큰 변동성이 있기 때문에 어려운 문제입니다. 기존의 대부분 접근법은 복잡한 모델 설계와/또는 추가적인 세부 주석에 크게 의존하는데, 이는 알고리즘 구현과 데이터 수집의 어려움을 일정 부분 증가시킵니다. 본 연구에서는 상업적으로 사용 가능한 신경망 구성 요소와 단어 수준의 주석만을 사용하여 불규칙한 장면 텍스트 인식을 위한 쉽게 구현할 수 있는 강력한 베이스라인을 제안합니다. 이 방법은 31층짜리 ResNet, LSTM 기반 인코더-디코더 프레임워크 및 2차원 주목 모듈로 구성됩니다. 간단함에도 불구하고 제안된 방법은 견고하며 규칙적이고 불규칙적인 장면 텍스트 인식 벤치마크에서 최신 성능을 달성합니다. 코드는 다음 링크에서 확인할 수 있습니다: https://tinyurl.com/ShowAttendRead