HyperAIHyperAI

Command Palette

Search for a command to run...

Transformers pour la détection de texte

Xiang Zhang Yongwen Su Subarna Tripathi Zhuowen Tu

Résumé

Dans cet article, nous présentons TExt Spotting TRansformers (TESTR), un cadre générique et end-to-end pour la détection et la reconnaissance de texte dans des environnements réels, basé sur les Transformers. TESTR repose sur un seul encodeur et deux décodeurs permettant conjointement la régression des points de contrôle des boîtes de texte et la reconnaissance des caractères. Contrairement à la plupart des travaux existants, notre méthode est indépendante des opérations de région d’intérêt (Region-of-Interest) et des étapes de post-traitement heuristiques ; TESTR s’avère particulièrement efficace pour traiter les textes courbés, où des ajustements spécifiques sont nécessaires pour adapter les représentations traditionnelles par boîtes englobantes. Nous proposons une représentation canonique des points de contrôle adaptée aux instances de texte, qu’elles soient annotées sous forme de courbes de Bézier ou de polygones. Par ailleurs, nous avons conçu un processus de détection de polygones guidé par des boîtes englobantes (box-to-polygon). Les expériences menées sur des jeux de données comprenant des textes courbés et de formes arbitraires démontrent que l’algorithme TESTR atteint des performances de pointe par rapport aux méthodes existantes.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp