HyperAIHyperAI
il y a 8 jours

ABCNet : Détection en temps réel de texte scènique basée sur un réseau à courbes de Bézier adaptatives

Yuliang Liu, Hao Chen, Chunhua Shen, Tong He, Lianwen Jin, Liangwei Wang
ABCNet : Détection en temps réel de texte scènique basée sur un réseau à courbes de Bézier adaptatives
Résumé

La détection et la reconnaissance de texte dans les scènes ont suscité un intérêt croissant dans la recherche. Les méthodes existantes peuvent être grossièrement classées en deux catégories : basées sur les caractères et basées sur la segmentation. Ces approches sont soit coûteuses en termes d’étiquetage des caractères, soit nécessitent une chaîne de traitement complexe, ce qui les rend souvent peu adaptées aux applications en temps réel. Dans ce travail, nous abordons ce problème en proposant le réseau adaptatif à courbe de Bézier (ABCNet). Nos contributions sont triples : 1) Pour la première fois, nous ajustons de manière adaptative des textes de forme arbitraire à l’aide d’une courbe de Bézier paramétrée. 2) Nous concevons une nouvelle couche BezierAlign permettant d’extraire des caractéristiques convolutives précises pour des instances de texte de forme arbitraire, améliorant significativement la précision par rapport aux méthodes précédentes. 3) Contrairement à la détection par boîte englobante standard, notre détection basée sur les courbes de Bézier introduit un surcoût computationnel négligeable, ce qui confère à notre méthode un avantage indéniable en termes à la fois d’efficacité et de précision. Des expériences menées sur des jeux de données standard à texte de forme arbitraire, à savoir Total-Text et CTW1500, démontrent que ABCNet atteint un niveau d’exactitude de pointe, tout en améliorant notablement la vitesse. En particulier, sur Total-Text, notre version en temps réel est plus de dix fois plus rapide que les méthodes de pointe récentes, tout en maintenant une précision compétitive en reconnaissance. Le code est disponible à l’adresse suivante : https://tinyurl.com/AdelaiDet

ABCNet : Détection en temps réel de texte scènique basée sur un réseau à courbes de Bézier adaptatives | Articles de recherche récents | HyperAI