2달 전

회전에 민감한 회귀를 이용한 방향성 장면 텍스트 검출

Minghui Liao; Zhen Zhu; Baoguang Shi; Gui-song Xia; Xiang Bai
회전에 민감한 회귀를 이용한 방향성 장면 텍스트 검출
초록

자연 이미지에서의 텍스트는 임의의 방향을 가지므로, 회전된 경계 상자(oriented bounding boxes)를 이용한 검출이 필요합니다. 일반적으로 다중 방향 텍스트 검출기는 두 가지 주요 작업을 포함합니다: 1) 텍스트 존재 검출, 이는 텍스트 방향을 고려하지 않는 분류 문제입니다; 2) 회전된 경계 상자 회귀, 이는 텍스트 방향에 대해 관심을 가지고 있습니다. 기존 방법들은 두 작업 모두에 공유된 특징을 사용하여 성능 저하를 초래하였습니다. 이러한 문제를 해결하기 위해, 우리는 서로 다른 설계로 구성된 두 개의 네트워크 브랜치에서 추출한 서로 다른 특성을 가진 특징들에 대해 분류와 회귀를 수행하는 방법을 제안합니다. 구체적으로, 회귀 브랜치는 합성곱 필터를 적극적으로 회전시켜 회전에 민감한 특징을 추출하고, 분류 브랜치는 회전에 민감한 특징들을 풀링(pooling)하여 회전 불변 특징을 추출합니다. 제안된 방법은 Rotation-sensitive Regression Detector (RRD)로 명명되었으며, ICDAR 2015, MSRA-TD500, RCTW-17 및 COCO-Text 등 세 개의 방향성 장면 텍스트 벤치마크 데이터셋에서 최고 수준의 성능을 달성하였습니다. 또한 RRD는 선박 수집 데이터셋에서도 큰 성능 향상을 보여주어, 방향성 객체 검출에 대한 일반성을 입증하였습니다.

회전에 민감한 회귀를 이용한 방향성 장면 텍스트 검출 | 최신 연구 논문 | HyperAI초신경