2달 전

Pyramid Attention Network을 사용한 Mask R-CNN을 통한 장면 텍스트 검출

Huang, Zhida ; Zhong, Zhuoyao ; Sun, Lei ; Huo, Qiang
Pyramid Attention Network을 사용한 Mask R-CNN을 통한 장면 텍스트 검출
초록

본 논문에서는 자연 환경 이미지에서 다방향 및 곡선 텍스트를 통합적으로 강건하게 검출할 수 있는 새로운 Mask R-CNN 기반의 텍스트 검출 방법을 제시합니다. Mask R-CNN의 텍스트 검출 작업에 대한 특징 표현 능력을 향상시키기 위해 피라미드 어텐션 네트워크(PAN, Pyramid Attention Network)를 Mask R-CNN의 새로운 백본 네트워크로 사용하는 것을 제안합니다. 실험 결과, PAN은 텍스트와 유사한 배경으로 인한 오보를 더 효과적으로 억제할 수 있음을 보여주었습니다. 제안된 접근법은 단일 스케일과 단일 모델 테스팅만을 사용하여 다방향(ICDAR-2015, ICDAR-2017 MLT) 및 곡선(SCUT-CTW1500) 텍스트 검출 벤치마크 작업에서 우수한 성능을 달성하였습니다.