HyperAIHyperAI
il y a 16 jours

SEED : Cadre Encoder-Décoder à Amélioration Sémantique pour la Reconnaissance de Texte dans les Scènes

Zhi Qiao, Yu Zhou, Dongbao Yang, Yucan Zhou, Weiping Wang
SEED : Cadre Encoder-Décoder à Amélioration Sémantique pour la Reconnaissance de Texte dans les Scènes
Résumé

La reconnaissance de texte dans les images est un sujet de recherche très actif en vision par ordinateur. Récemment, de nombreuses méthodes de reconnaissance basées sur le cadre encodeur-décodeur ont été proposées, permettant de traiter efficacement des textes scènes présentant des distorsions perspective ou des formes courbées. Toutefois, ces approches rencontrent encore de nombreux défis, tels que le flou d'image, l'éclairage inégal ou la présence de caractères incomplets. Nous affirmons que la plupart des méthodes encodeur-décodeur actuelles reposent principalement sur des caractéristiques visuelles locales, sans intégrer explicitement d'informations sémantiques globales. Dans ce travail, nous proposons un cadre encodeur-décodeur amélioré par l'information sémantique, afin de reconnaître de manière robuste des textes de faible qualité dans les images. L'information sémantique est exploitée à la fois dans le module encodeur comme signal de supervision et dans le module décodeur comme initialisation. Plus précisément, la méthode de pointe ASTER est intégrée dans le cadre proposé comme exemple. Des expériences étendues démontrent que le cadre proposé est plus robuste face aux images de texte de faible qualité, et atteint des résultats de pointe sur plusieurs jeux de données standard.

SEED : Cadre Encoder-Décoder à Amélioration Sémantique pour la Reconnaissance de Texte dans les Scènes | Articles de recherche récents | HyperAI