HyperAIHyperAI
vor 2 Monaten

Fused Text Segmentation Netze für die Erkennung von multi-orientiertem Szene-Text

Dai, Yuchen ; Huang, Zheng ; Gao, Yuting ; Xu, Youxuan ; Chen, Kai ; Guo, Jie ; Qiu, Weidong
Fused Text Segmentation Netze für die Erkennung von multi-orientiertem Szene-Text
Abstract

In dieser Arbeit stellen wir ein neues End-to-End-Framework für die Detektion von mehrorientiertem Szentext aus der Perspektive einer instanzbasierten semantischen Segmentierung vor. Wir präsentieren die Fused Text Segmentation Networks (FTSN), die während des Feature-Extraktionsprozesses Features auf mehreren Ebenen kombinieren, da Textinstanzen im Vergleich zu allgemeinen Objekten oft eine feinere Feature-Darstellung erfordern. Diese Methode detektiert und segmentiert Textinstanzen gemeinsam und gleichzeitig, wobei sie die Vorteile sowohl der semantischen Segmentierung als auch der regionsbasierenden Objekterkennung nutzt. Ohne zusätzliche Pipelines zu verwenden, übertrifft unser Ansatz den aktuellen Stand der Technik in den Benchmarks für mehrorientierte Szentextdetektion: ICDAR2015 Incidental Scene Text und MSRA-TD500, wobei wir jeweils einen H-Mean von 84,1 % und 82,0 % erreichen. Darüber hinaus geben wir eine Baseline für das Total-Text-Datensatz mit gekrümmtem Text an, die die Effektivität des vorgeschlagenen Ansatzes unterstreicht.

Fused Text Segmentation Netze für die Erkennung von multi-orientiertem Szene-Text | Neueste Forschungsarbeiten | HyperAI