HyperAIHyperAI

Command Palette

Search for a command to run...

Réseau d'attention déconnectée pour la reconnaissance de texte

Tianwei Wang Yuanzhi Zhu Lianwen Jin Canjie Luo Xiaoxue Chen Yaqiang Wu Qianying Wang Mingxiang Cai

Résumé

La reconnaissance de texte a suscité un intérêt de recherche considérable en raison de ses nombreuses applications. Les méthodes de pointe en reconnaissance de texte reposent sur des mécanismes d’attention. Toutefois, la plupart de ces approches basées sur l’attention souffrent d’un problème sérieux d’alignement, dû à leur opération récurrente d’alignement, qui dépend des résultats de décodage historiques. Pour remédier à ce défaut, nous proposons un réseau d’attention déconnectée (DAN, Decoupled Attention Network), qui déconnecte l’opération d’alignement des résultats de décodage passés. DAN est un reconnaisseur de texte end-to-end efficace, flexible et robuste, composé de trois composants : 1) un encodeur de caractéristiques qui extrait les caractéristiques visuelles à partir de l’image d’entrée ; 2) un module d’alignement convolutif qui réalise l’opération d’alignement à partir des caractéristiques visuelles extraites par l’encodeur ; et 3) un décodeur de texte déconnecté qui effectue la prédiction finale en combinant conjointement la carte de caractéristiques et les cartes d’attention. Les résultats expérimentaux montrent que DAN atteint des performances de pointe sur plusieurs tâches de reconnaissance de texte, notamment la reconnaissance de texte manuscrit en ligne et hors ligne, ainsi que la reconnaissance de texte scènique régulier et irrégulier.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp