2달 전
감독된 피라미드 컨텍스트 네트워크를 이용한 장면 텍스트 검출
Enze Xie; Yuhang Zang; Shuai Shao; Gang Yu; Cong Yao; Guangyao Li

초록
최근 몇 년 동안 딥 러닝 기반의 장면 텍스트 검출 방법은 뛰어난 성과를 거두었습니다. 그러나 자연 환경의 높은 다양성과 복잡성으로 인해, 기존의 최신 텍스트 검출 방법이 실제 환경에서 촬영된 이미지에 적용될 때 여전히 상당한 양의 오검출을 생성할 수 있습니다. 이 문제를 해결하기 위해 본 논문에서는 마스크 R-CNN에서 주로 영감을 받아, 피처 피라미드 네트워크(FPN)와 인스턴스 분할을 기반으로 하는 효과적인 장면 텍스트 검출 모델을 제안합니다. 우리는 정확한 텍스트 영역 위치 결정과 오검출 억제를 위해 지도 피라미드 컨텍스트 네트워크(SPCNET)를 제안합니다. 의미 정보의 안내와 FPN 공유 덕분에, SPCNET은 추가 계산량이 미미한 상태에서 성능이 크게 향상되었습니다. 표준 데이터셋에서 수행된 실험 결과, 우리의 SPCNET이 최신 방법론보다 명확히 우수함을 입증하였습니다. 특히, ICDAR2013에서는 F-측정값 92.1%, ICDAR2015에서는 87.2%, ICDAR2017 MLT에서는 74.1%, Total-Text에서는 82.9%의 성능을 달성하였습니다.