HyperAIHyperAI
il y a 11 jours

SAFL : Reconnaissant de texte scènes à attention auto-avec perte focale

Bao Hieu Tran, Thanh Le-Cong, Huu Manh Nguyen, Duc Anh Le, Thanh Hung Nguyen, Phi Le Nguyen
SAFL : Reconnaissant de texte scènes à attention auto-avec perte focale
Résumé

Au cours des dernières décennies, la reconnaissance de texte dans les scènes a suscité un intérêt mondial tant de la part de la communauté académique que des utilisateurs pratiques, en raison de son importance dans un large éventail d'applications. Malgré les progrès réalisés en reconnaissance optique des caractères, la reconnaissance de texte dans les scènes reste un défi en raison de problèmes intrinsèques tels que les distorsions ou les dispositions irrégulières des textes. La plupart des approches existantes s'appuient principalement sur des réseaux neuronaux récurrents ou basés sur la convolution. Toutefois, bien que les réseaux neuronaux récurrents (RNN) souffrent généralement d'une vitesse d'entraînement lente due au calcul séquentiel, ainsi que de problèmes tels que le gradient qui s'atténue ou les goulets d'étranglement, les réseaux de convolution (CNN) se heurtent à un compromis entre complexité et performance. Dans cet article, nous proposons SAFL, un modèle de réseau neuronal basé sur l'attention auto-attentionnel et utilisant une perte focalisée pour la reconnaissance de texte dans les scènes, afin de surmonter les limites des approches existantes. L'utilisation de la perte focalisée au lieu de la log-vraisemblance négative permet au modèle de se concentrer davantage sur les échantillons à faible fréquence pendant l'entraînement. En outre, pour traiter les distorsions et les textes irréguliers, nous exploitons le Spatial Transformer Network (STN) afin de rectifier le texte avant de le transmettre au réseau de reconnaissance. Nous menons des expériences pour comparer les performances du modèle proposé avec sept benchmarks. Les résultats numériques montrent que notre modèle obtient les meilleures performances.

SAFL : Reconnaissant de texte scènes à attention auto-avec perte focale | Articles de recherche récents | HyperAI