HyperAIHyperAI

Command Palette

Search for a command to run...

SEED : Cadre Encoder-Décoder à Amélioration Sémantique pour la Reconnaissance de Texte dans les Scènes

Zhi Qiao Yu Zhou Dongbao Yang Yucan Zhou Weiping Wang

Résumé

La reconnaissance de texte dans les images est un sujet de recherche très actif en vision par ordinateur. Récemment, de nombreuses méthodes de reconnaissance basées sur le cadre encodeur-décodeur ont été proposées, permettant de traiter efficacement des textes scènes présentant des distorsions perspective ou des formes courbées. Toutefois, ces approches rencontrent encore de nombreux défis, tels que le flou d'image, l'éclairage inégal ou la présence de caractères incomplets. Nous affirmons que la plupart des méthodes encodeur-décodeur actuelles reposent principalement sur des caractéristiques visuelles locales, sans intégrer explicitement d'informations sémantiques globales. Dans ce travail, nous proposons un cadre encodeur-décodeur amélioré par l'information sémantique, afin de reconnaître de manière robuste des textes de faible qualité dans les images. L'information sémantique est exploitée à la fois dans le module encodeur comme signal de supervision et dans le module décodeur comme initialisation. Plus précisément, la méthode de pointe ASTER est intégrée dans le cadre proposé comme exemple. Des expériences étendues démontrent que le cadre proposé est plus robuste face aux images de texte de faible qualité, et atteint des résultats de pointe sur plusieurs jeux de données standard.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
SEED : Cadre Encoder-Décoder à Amélioration Sémantique pour la Reconnaissance de Texte dans les Scènes | Articles | HyperAI