8일 전

ABCNet: 적응형 베지어 곡선 네트워크를 활용한 실시간 시나리오 텍스트 스폿팅

Yuliang Liu, Hao Chen, Chunhua Shen, Tong He, Lianwen Jin, Liangwei Wang
ABCNet: 적응형 베지어 곡선 네트워크를 활용한 실시간 시나리오 텍스트 스폿팅
초록

장면 텍스트 검출 및 인식은 최근 연구 주목을 받고 있다. 기존의 방법들은 대체로 문자 기반( character-based )과 세그멘테이션 기반( segmentation-based )으로 크게 나뉜다. 그러나 이러한 방법들은 either 문자 레이블링에 높은 비용이 들거나, 복잡한 파이프라인을 유지해야 하며, 실시간 응용에는 적합하지 않은 경우가 많다. 본 연구에서는 이러한 문제를 해결하기 위해 적응형 베지어 곡선 네트워크(Adaptive Bezier-Curve Network, ABCNet)를 제안한다. 본 연구의 기여는 세 가지이다. 1) 본 연구에서는 처음으로 매개변수화된 베지어 곡선을 사용하여 임의의 형태를 가진 텍스트를 적응적으로 피팅한다. 2) 임의의 형태를 가진 텍스트 인스턴스에 대해 정확한 컨볼루션 특징을 추출하기 위해 새로운 베지어 앨라이너(BezierAlign) 레이어를 설계하였으며, 기존 방법 대비 정밀도를 크게 향상시켰다. 3) 기준 경계 박스 검출 방식과 비교했을 때, 베지어 곡선 기반 검출은 계산 오버헤드를 거의 추가하지 않으며, 효율성과 정확도 면에서 모두 우수한 성능을 발휘한다. Total-Text 및 CTW1500과 같은 임의 형태 텍스트 기준 데이터셋에서의 실험 결과, ABCNet은 최고 수준의 정확도를 달성하면서도 처리 속도를 크게 향상시켰다. 특히 Total-Text 데이터셋에서 실시간 버전은 최근 최고 수준의 방법들보다 10배 이상 빠르며, 경쟁력 있는 인식 정확도를 유지한다. 코드는 다음 링크에서 확인 가능하다: https://tinyurl.com/AdelaiDet

ABCNet: 적응형 베지어 곡선 네트워크를 활용한 실시간 시나리오 텍스트 스폿팅 | 최신 연구 논문 | HyperAI초신경