HyperAIHyperAI

Command Palette

Search for a command to run...

Reconnaissance de texte manuscrit paragraphe par bout en bout utilisant un réseau d'attention verticale

Denis Coquenet Clément Chatelain Thierry Paquet

Résumé

La reconnaissance de texte manuscrit non contraint reste un défi pour les systèmes de vision par ordinateur. La reconnaissance de paragraphes est traditionnellement réalisée en deux étapes : un premier modèle pour la segmentation des lignes, suivi d’un second modèle pour la reconnaissance des lignes de texte. Nous proposons un modèle unifié, end-to-end, basé sur un mécanisme d’attention hybride, pour traiter cette tâche. Ce modèle est conçu pour traiter itérativement une image de paragraphe ligne par ligne. Il se compose de trois modules principaux. Un encodeur génère des cartes de caractéristiques à partir de l’image complète du paragraphe. Ensuite, un module d’attention produit de manière récurrente un masque pondéré vertical, permettant de se concentrer sur les caractéristiques de la ligne de texte courante. Cette approche réalise ainsi une forme de segmentation implicite des lignes. Pour chaque ensemble de caractéristiques de ligne de texte, un module décodeur reconnaît la séquence de caractères associée, aboutissant ainsi à la reconnaissance complète du paragraphe. Nous atteignons un taux d’erreur caractères au niveau du paragraphe parmi les meilleurs actuellement enregistrés sur trois jeux de données populaires : 1,91 % pour RIMES, 4,45 % pour IAM et 3,59 % pour READ 2016. Notre code source ainsi que les poids du modèle entraîné sont disponibles à l’adresse suivante : https://github.com/FactoDeepLearning/VerticalAttentionOCR.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp