HyperAIHyperAI

Command Palette

Search for a command to run...

Détecteur de Texte à Masque Pyramidal

Jingchao Liu; Xuebo Liu; Jie Sheng; Ding Liang; Xin Li; Qingjie Liu

Résumé

La détection de texte en scène, une étape cruciale du système de reconnaissance de texte en scène, consiste à localiser automatiquement les instances de texte dans des images naturelles. Certaines tentatives récentes, profitant des avantages de Mask R-CNN, ont formulé la tâche de détection de texte en scène comme un problème de segmentation d'instances et ont obtenu des performances remarquables. Dans cet article, nous présentons un nouveau cadre basé sur Mask R-CNN nommé Pyramid Mask Text Detector (PMTD) pour traiter la détection de texte en scène. Contrairement aux masques binaires de texte générés par les méthodes existantes basées sur Mask R-CNN, notre PMTD effectue une régression au niveau pixel sous la direction d'une supervision sensible à l'emplacement, produisant ainsi un masque de texte plus informatif et doux pour chaque instance de texte. En ce qui concerne la génération des boîtes de texte, PMTD réinterprète le masque doux 2D obtenu dans l'espace 3D et introduit un nouvel algorithme de regroupement plan pour déduire la boîte de texte optimale sur la base de la forme 3D. Les expériences menées sur des jeux de données standards montrent que le PMTD proposé apporte une amélioration constante et notable, surpassant clairement les méthodes les plus avancées actuellement disponibles. Plus précisément, il atteint un F-mesure de 80,13 % sur le jeu de données ICDAR 2017 MLT.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp