HyperAIHyperAI
il y a 2 mois

TextBoxes++ : Un détecteur de texte en scène orienté à une seule passe

Minghui Liao; Baoguang Shi; Xiang Bai
TextBoxes++ : Un détecteur de texte en scène orienté à une seule passe
Résumé

La détection de texte en scène est une étape importante du système de reconnaissance de texte en scène et constitue également un problème difficile. Contrairement à la détection d'objets généraux, les principaux défis de la détection de texte en scène résident dans les orientations arbitraires, les tailles réduites et les rapports d'aspect très variables du texte dans les images naturelles. Dans cet article, nous présentons un détecteur de texte en scène rapide et entièrement entraînable en une seule passe, nommé TextBoxes++. Ce modèle détecte le texte orienté arbitrairement avec une grande précision et efficacité. Aucun traitement postérieur autre qu'une suppression non maximale efficace n'est nécessaire. Nous avons évalué le TextBoxes++ proposé sur quatre jeux de données publics. Dans toutes les expériences, TextBoxes++ surpassait les méthodes concurrentes en termes de précision de localisation du texte et de temps d'exécution. Plus précisément, TextBoxes++ atteint un f-mesure de 0,817 à 11,6 images par seconde (fps) pour des images de texte incidentiel ICDAR 2015 (10241024), et un f-mesure de 0,5591 à 19,8 fps pour des images COCO-Text (768768). De plus, associé à un reconnaisseur de texte, TextBoxes++ dépasse considérablement les approches les plus avancées pour les tâches de repérage de mots et de reconnaissance de texte bout-en-bout sur des benchmarks populaires. Le code est disponible à l'adresse suivante : https://github.com/MhLiao/TextBoxes_plusplus

TextBoxes++ : Un détecteur de texte en scène orienté à une seule passe | Articles de recherche récents | HyperAI