2달 전

다중 방향 장면 텍스트 검출을 위한 융합된 텍스트 분할 네트워크

Dai, Yuchen ; Huang, Zheng ; Gao, Yuting ; Xu, Youxuan ; Chen, Kai ; Guo, Jie ; Qiu, Weidong
다중 방향 장면 텍스트 검출을 위한 융합된 텍스트 분할 네트워크
초록

본 논문에서는 인스턴스 인식 기반 의미 분할 관점에서 다방향 장면 텍스트 검출을 위한 새로운 엔드-투-엔드 프레임워크를 소개합니다. 우리는 다수준 특징을 결합하여 텍스트 인스턴스가 일반 객체보다 더 세부적인 특징 표현에 의존할 수 있다는 점을 고려한 Fused Text Segmentation Networks(융합 텍스트 분할 네트워크)를 제시합니다. 이 방법은 의미 분할 작업과 영역 제안 기반 객체 검출 작업의 장점을 활용하여 텍스트 인스턴스를 공동으로 동시에 검출하고 분할합니다. 어떠한 추가적인 파이프라인도 포함하지 않음에도 불구하고, 우리의 접근 방식은 ICDAR2015 우발적 장면 텍스트와 MSRA-TD500 벤치마크에서 각각 Hmean 84.1%와 82.0%를 달성하며 현재 최고 수준의 다방향 장면 텍스트 검출 성능을 초월합니다. 또한, 곡선 텍스트가 포함된 Total-Text 데이터셋에서의 베이스라인 결과를 보고하여 제안된 접근 방식의 효과성을 입증합니다.

다중 방향 장면 텍스트 검출을 위한 융합된 텍스트 분할 네트워크 | 최신 연구 논문 | HyperAI초신경