Command Palette
Search for a command to run...
Réseaux de segmentation de texte fusionnés pour la détection de texte scénique multi-orienté
Réseaux de segmentation de texte fusionnés pour la détection de texte scénique multi-orienté
Résumé
Dans cet article, nous introduisons un nouveau cadre end-to-end pour la détection de texte scénique multi-orienté, basé sur une perspective de segmentation sémantique consciente des instances. Nous proposons les Réseaux de segmentation textuelle fusionnés (Fused Text Segmentation Networks), qui combinent des caractéristiques à plusieurs niveaux durant l'extraction de caractéristiques, car les instances de texte peuvent nécessiter une expression plus fine que les objets généraux. Notre méthode détecte et segmente simultanément les instances de texte, tirant parti des avantages des deux tâches : la segmentation sémantique et la détection d'objets basée sur la proposition de régions. Sans nécessiter de pipeline supplémentaire, notre approche dépasse l'état de l'art actuel sur les benchmarks de détection de texte scénique multi-orienté : ICDAR2015 Incidental Scene Text et MSRA-TD500, atteignant respectivement un score Hmean de 84,1 % et 82,0 %. En outre, nous proposons une base (baseline) sur Total-Text, qui inclut des textes courbés, démontrant ainsi l'efficacité de l'approche proposée.