2달 전
각점 기반 영역 제안을 이용한 다중 방향 텍스트 검출
Linjie Deng; Yanxiang Gong; Yi Lin; Jingwen Shuai; Xiaoguang Tu; Yuefei Zhang; Zheng Ma; Mei Xie

초록
이전의 장면 텍스트 검출 방법은 일반적으로 수동으로 정의된 슬라이딩 윈도우에 의존해 왔습니다. 본 연구에서는 텍스트 형태에 대한 사전 지식 없이 다양한 방향의 텍스트를 검출하기 위한 직관적인 두 단계 지역 기반 방법을 제시합니다. 첫 번째 단계에서는 기본 앵커를 이동하는 대신 코너를 감지하고 연결하여 텍스트 인스턴스의 가능한 위치를 추정합니다. 이 사각형 제안들은 기하학적으로 적응적이므로, 우리의 방법은 다양한 텍스트 종횡비와 방향성을 처리할 수 있습니다. 두 번째 단계에서는 이러한 제안들에 대해 더 강건한 분류와 회귀를 수행하기 위해 지역별 하위 네트워크 내부에 데이터 증강을 포함하는 새로운 풀링 레이어인 Dual-RoI Pooling(듀얼-ROI 풀링)을 설계하였습니다. 공개 벤치마크에서의 실험 결과는 제안된 방법이 최신 기법들과 유사한 성능을 달성할 수 있음을 확인해주고 있습니다. 코드는 https://github.com/xhzdeng/crpn 에서 공개되어 있습니다.