HyperAIHyperAI
il y a un mois

Mask TextSpotter : Un réseau neuronal entièrement entraînable pour la détection de texte de formes arbitraires

Pengyuan Lyu; Minghui Liao; Cong Yao; Wenhao Wu; Xiang Bai
Mask TextSpotter : Un réseau neuronal entièrement entraînable pour la détection de texte de formes arbitraires
Résumé

Récemment, les modèles basés sur les réseaux neuronaux profonds ont dominé les domaines de la détection et de la reconnaissance du texte en scène. Dans cet article, nous examinons le problème de la localisation du texte en scène, qui vise à détecter et reconnaître simultanément le texte dans des images naturelles. Nous proposons un modèle de réseau neuronal entièrement entraînable pour la localisation du texte en scène. Le modèle proposé, nommé Mask TextSpotter, s'inspire du travail récemment publié Mask R-CNN. Contrairement aux méthodes précédentes qui accomplissent également la localisation du texte avec des réseaux neuronaux profonds entièrement entraînables, Mask TextSpotter bénéficie d'une procédure d'apprentissage simple et fluide, dans laquelle une détection précise et une reconnaissance du texte sont obtenues par segmentation sémantique. De plus, il est supérieur aux méthodes précédentes pour traiter des instances de texte de formes irrégulières, par exemple, le texte courbe. Les expériences menées sur ICDAR2013, ICDAR2015 et Total-Text montrent que la méthode proposée atteint des résultats de pointe dans les tâches de détection du texte en scène et de reconnaissance du texte entièrement automatique.

Mask TextSpotter : Un réseau neuronal entièrement entraînable pour la détection de texte de formes arbitraires | Articles de recherche récents | HyperAI