2달 전

시퀀스 없는 박스 이산화를 이용한 전방위 장면 텍스트 검출

Yuliang Liu; Sheng Zhang; Lianwen Jin; Lele Xie; Yaqiang Wu; Zhepeng Wang
시퀀스 없는 박스 이산화를 이용한 전방위 장면 텍스트 검출
초록

야외 환경에서의 장면 텍스트는 일반적으로 높은 변이 특성을 가진 형태로 제시됩니다. 텍스트 인스턴스를 위치시키기 위해 사각형 경계 상자(quadrilateral bounding box)를 사용하는 것은 거의 필수적인 방법입니다. 그러나 최근 연구들은 장면 텍스트 검출을 위해 사각형 경계 상자를 도입하면 쉽게 간과될 수 있는 라벨 혼동 문제(label confusion issue)가 발생할 수 있으며, 이 문제는 검출 성능에 크게 악영향을 미칠 수 있음을 밝혔습니다. 이러한 문제를 해결하기 위해 본 논문에서는 새로운 방법인 순차적 제약 없는 박스 이산화(Sequential-free Box Discretization, SBD)를 제안합니다. 이 방법은 경계 상자를 주요 변(key edges, KE)으로 이산화하여 더 효과적인 검출 성능 개선 방법을 도출할 수 있습니다. 실험 결과, 제안된 방법이 ICDAR 2015, MLT, MSRA-TD500 등 여러 유명한 장면 텍스트 벤치마크에서 최신 기술(state-of-the-art methods)보다 우수한 성능을 보였습니다. 또한, 마스크 R-CNN 프레임워크에 단순히 SBD를 통합해도 검출 성능이 크게 향상됨을 확인하는 아블레이션 연구(ablation study)도 수행되었습니다. 더 나아가, 일반 객체 데이터셋 HRSC2016 (다중 방향 선박)에서의 실험 결과, 제안된 방법이 최신 기술보다 큰 차이로 우수한 성능을 보여 그 강력한 일반화 능력을 입증하였습니다. 소스 코드: https://github.com/Yuliang-Liu/Box_Discretization_Network.

시퀀스 없는 박스 이산화를 이용한 전방위 장면 텍스트 검출 | 최신 연구 논문 | HyperAI초신경