2달 전

기하학적 정규화 네트워크를 이용한 정확한 장면 텍스트 검출

Youjiang Xu; Jiaqi Duan; Zhanghui Kuang; Xiaoyu Yue; Hongbin Sun; Yue Guan; Wayne Zhang
기하학적 정규화 네트워크를 이용한 정확한 장면 텍스트 검출
초록

장면 텍스트 검출에서 큰 기하학적 변동(예: 방향성)은 주요 과제입니다. 본 연구에서는 먼저 네트워크가 장면 텍스트 검출을 위한 기하학적 변동 학습에 대한 용량을 조사하기 위해 실험을 수행하고, 네트워크가 제한된 범위의 텍스트 기하학적 변동만 처리할 수 있음을 발견하였습니다. 그 다음으로, 각각 하나의 스케일 정규화 유닛과 하나의 방향성 정규화 유닛으로 구성된 여러 가지 분기를 갖는 새로운 기하학적 정규화 모듈(Geometry Normalization Module, GNM)을 제안하였습니다. 이 GNM은 일반적이며, 기존의 컨볼루션 신경망 기반 텍스트 검출기와 쉽게 통합하여 단일 분지를 통해 각 텍스트 인스턴스를 원하는 표준 기하학적 범위로 정규화하는 엔드투엔드 기하학적 정규화 네트워크(Geometry Normalization Networks, GNNets)를 구축할 수 있습니다. 또한, 균일한 기하학적 변동 분포에서 텍스트 인스턴스를 샘플링하고 증강하여 GNNets를 효과적으로 학습시키는 기하학적 인식 학습 방안을 제안하였습니다. 마지막으로, ICDAR 2015 및 ICDAR 2017 MLT 벤치마크에서 수행한 실험 결과, 본 방법이 각각 88.52와 74.54의 F-점수를 얻어 모든 최신 접근법보다 뚜렷하게 우수함을 확인하였습니다.

기하학적 정규화 네트워크를 이용한 정확한 장면 텍스트 검출 | 최신 연구 논문 | HyperAI초신경