HyperAIHyperAI
il y a 2 mois

Détection multi-orientée du texte dans les scènes par localisation des coins et segmentation des régions

Lyu, Pengyuan ; Yao, Cong ; Wu, Wenhao ; Yan, Shuicheng ; Bai, Xiang
Détection multi-orientée du texte dans les scènes par localisation des coins et segmentation des régions
Résumé

Les méthodes précédentes de détection de texte en scène basées sur l'apprentissage profond peuvent être approximativement classées en deux catégories. La première catégorie traite le texte en scène comme un type d'objets généraux et suit le paradigme de détection d'objets généraux pour localiser le texte en régressant les positions des boîtes de texte, mais elle est confrontée aux orientations arbitraires et aux grands rapports d'aspect du texte en scène. La seconde catégorie segmente directement les régions textuelles, mais nécessite généralement un traitement postérieur complexe. Dans cet article, nous présentons une méthode qui combine les idées des deux types de méthodes tout en évitant leurs inconvénients. Nous proposons de détecter le texte en scène en localisant les points angulaires des boîtes englobantes de texte et en segmentant les régions textuelles dans des positions relatives. Pendant la phase d'inférence, des boîtes candidates sont générées par échantillonnage et groupement des points angulaires, qui sont ensuite évaluées par les cartes de segmentation et supprimées par NMS (Non-Maximum Suppression). Comparée aux méthodes précédentes, notre méthode peut traiter naturellement le texte orienté long et n'a pas besoin d'un traitement postérieur complexe. Les expériences menées sur ICDAR2013, ICDAR2015, MSRA-TD500, MLT et COCO-Text montrent que l'algorithme proposé atteint des résultats meilleurs ou comparables tant en termes de précision qu'efficacité. Basé sur VGG16, il obtient un F-mesure de 84,3% sur ICDAR2015 et 81,5% sur MSRA-TD500.

Détection multi-orientée du texte dans les scènes par localisation des coins et segmentation des régions | Articles de recherche récents | HyperAI