HyperAIHyperAI

Command Palette

Search for a command to run...

Mask TextSpotter : Un réseau neuronal entièrement entraînable pour la détection de texte de formes arbitraires

Pengyuan Lyu Minghui Liao Cong Yao Wenhao Wu Xiang Bai

Résumé

Récemment, les modèles basés sur les réseaux neuronaux profonds ont dominé les domaines de la détection et de la reconnaissance du texte en scène. Dans cet article, nous examinons le problème de la localisation du texte en scène, qui vise à détecter et reconnaître simultanément le texte dans des images naturelles. Nous proposons un modèle de réseau neuronal entièrement entraînable pour la localisation du texte en scène. Le modèle proposé, nommé Mask TextSpotter, s'inspire du travail récemment publié Mask R-CNN. Contrairement aux méthodes précédentes qui accomplissent également la localisation du texte avec des réseaux neuronaux profonds entièrement entraînables, Mask TextSpotter bénéficie d'une procédure d'apprentissage simple et fluide, dans laquelle une détection précise et une reconnaissance du texte sont obtenues par segmentation sémantique. De plus, il est supérieur aux méthodes précédentes pour traiter des instances de texte de formes irrégulières, par exemple, le texte courbe. Les expériences menées sur ICDAR2013, ICDAR2015 et Total-Text montrent que la méthode proposée atteint des résultats de pointe dans les tâches de détection du texte en scène et de reconnaissance du texte entièrement automatique.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Mask TextSpotter : Un réseau neuronal entièrement entraînable pour la détection de texte de formes arbitraires | Articles | HyperAI