il y a 7 mois

Résumé

La détection de texte en scène, une étape cruciale du système de reconnaissance de texte en scène, consiste à localiser automatiquement les instances de texte dans des images naturelles. Certaines tentatives récentes, profitant des avantages de Mask R-CNN, ont formulé la tâche de détection de texte en scène comme un problème de segmentation d'instances et ont obtenu des performances remarquables. Dans cet article, nous présentons un nouveau cadre basé sur Mask R-CNN nommé Pyramid Mask Text Detector (PMTD) pour traiter la détection de texte en scène. Contrairement aux masques binaires de texte générés par les méthodes existantes basées sur Mask R-CNN, notre PMTD effectue une régression au niveau pixel sous la direction d'une supervision sensible à l'emplacement, produisant ainsi un masque de texte plus informatif et doux pour chaque instance de texte. En ce qui concerne la génération des boîtes de texte, PMTD réinterprète le masque doux 2D obtenu dans l'espace 3D et introduit un nouvel algorithme de regroupement plan pour déduire la boîte de texte optimale sur la base de la forme 3D. Les expériences menées sur des jeux de données standards montrent que le PMTD proposé apporte une amélioration constante et notable, surpassant clairement les méthodes les plus avancées actuellement disponibles. Plus précisément, il atteint un F-mesure de 80,13 % sur le jeu de données ICDAR 2017 MLT.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Détection D'objets

Segmentation Sémantique

Réseau De Neurones Convolutif

Approche/Framework

Vision Par Ordinateur

Tâche

Jingchao Liu; Xuebo Liu; Jie Sheng; Ding Liang; Xin Li; Qingjie Liu

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Détection D'objets

Segmentation Sémantique

Réseau De Neurones Convolutif

Approche/Framework

Vision Par Ordinateur

Tâche

Jingchao Liu; Xuebo Liu; Jie Sheng; Ding Liang; Xin Li; Qingjie Liu

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Détecteur de Texte à Masque Pyramidal | Articles | HyperAI

Command Palette

Détecteur de Texte à Masque Pyramidal

Jingchao Liu; Xuebo Liu; Jie Sheng; Ding Liang; Xin Li; Qingjie Liu

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Détecteur de Texte à Masque Pyramidal

Jingchao Liu; Xuebo Liu; Jie Sheng; Ding Liang; Xin Li; Qingjie Liu

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Détecteur de Texte à Masque Pyramidal

Jingchao Liu; Xuebo Liu; Jie Sheng; Ding Liang; Xin Li; Qingjie Liu

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters