HyperAIHyperAI
il y a 11 jours

Détection de texte en scène en temps réel avec binarisation différentiable

Minghui Liao, Zhaoyi Wan, Cong Yao, Kai Chen, Xiang Bai
Détection de texte en scène en temps réel avec binarisation différentiable
Résumé

Récemment, les méthodes basées sur la segmentation sont devenues très populaires dans la détection de texte en scène, car les résultats de segmentation permettent une description plus précise du texte en scène de formes variées, telles que le texte courbé. Toutefois, le post-traitement par binarisation est essentiel pour la détection basée sur la segmentation, car il convertit les cartes de probabilité produites par une méthode de segmentation en boîtes englobantes ou régions textuelles. Dans cet article, nous proposons un module nommé Binarisation Différentiable (DB), capable d’effectuer le processus de binarisation à l’intérieur d’un réseau de segmentation. En étant optimisé conjointement avec ce module DB, un réseau de segmentation peut ajuster de manière adaptative les seuils de binarisation, ce qui non seulement simplifie le post-traitement, mais améliore également les performances de détection du texte. À partir d’un réseau de segmentation simple, nous validons les améliorations de performance apportées par DB sur cinq jeux de données de référence, obtenant systématiquement des résultats de pointe en termes d’exactitude de détection et de vitesse. En particulier, avec un squelette léger, les améliorations apportées par DB sont significatives, permettant ainsi d’atteindre un compromis idéal entre précision et efficacité. Plus précisément, avec un squelette ResNet-18, notre détecteur atteint une mesure F de 82,8, avec une fréquence d’image de 62 FPS sur le jeu de données MSRA-TD500. Le code est disponible à l’adresse suivante : https://github.com/MhLiao/DB

Détection de texte en scène en temps réel avec binarisation différentiable | Articles de recherche récents | HyperAI