HyperAIHyperAI

Command Palette

Search for a command to run...

Un réseau neuronal convolutif entraînable de bout en bout pour la reconnaissance de séquences basée sur les images et son application à la reconnaissance du texte dans les scènes

Baoguang Shi Xiang Bai Cong Yao

Résumé

La reconnaissance de séquences basée sur des images est un sujet de recherche de longue date en vision par ordinateur. Dans cet article, nous examinons le problème de la reconnaissance du texte dans les scènes, qui est l'une des tâches les plus importantes et les plus difficiles dans la reconnaissance de séquences basée sur des images. Nous proposons une nouvelle architecture de réseau neuronal qui intègre l'extraction de caractéristiques, la modélisation de séquences et la transcription dans un cadre unifié.Par rapport aux systèmes précédents pour la reconnaissance du texte dans les scènes, l'architecture proposée présente quatre propriétés distinctives : (1) Elle est entraînable d'un bout à l'autre, contrairement à la plupart des algorithmes existants dont les composants sont entraînés et ajustés séparément. (2) Elle gère naturellement des séquences de longueur arbitraire, sans nécessiter de segmentation de caractères ou de normalisation d'échelle horizontale. (3) Elle n'est pas limitée à un lexique prédéfini et obtient des performances remarquables tant dans les tâches de reconnaissance du texte dans les scènes sans lexique que basées sur un lexique. (4) Elle génère un modèle efficace mais beaucoup plus petit, ce qui le rend plus pratique pour des scénarios d'application réels.Les expériences menées sur des benchmarks standards, notamment les ensembles de données IIIT-5K, Street View Text et ICDAR, démontrent la supériorité de l'algorithme proposé par rapport aux techniques antérieures. De plus, l'algorithme proposé donne également d'excellents résultats dans la tâche de reconnaissance des partitions musicales basée sur des images, ce qui confirme évidemment sa généralité.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp