HyperAIHyperAI
il y a 2 mois

TextSnake : Une représentation flexible pour la détection de texte de formes arbitraires

Long, Shangbang ; Ruan, Jiaqiang ; Zhang, Wenjie ; He, Xin ; Wu, Wenhao ; Yao, Cong
TextSnake : Une représentation flexible pour la détection de texte de formes arbitraires
Résumé

Propulsées par les réseaux neuronaux profonds et les grands ensembles de données, les méthodes de détection de texte dans les scènes ont connu des progrès considérables ces dernières années, en renouvelant continuellement les records de performance sur diverses benchmarks standards. Cependant, limitées par les représentations adoptées pour décrire le texte (rectangles alignés sur l'axe, rectangles rotatifs ou quadrilatères), ces méthodes peuvent manquer d'efficacité lorsqu'il s'agit de traiter des instances de texte beaucoup plus libres, comme le texte courbe, qui sont en réalité très courantes dans des scénarios du monde réel. Pour résoudre ce problème, nous proposons une représentation plus flexible du texte dans les scènes, appelée TextSnake, capable de représenter efficacement des instances de texte sous forme horizontale, orientée et courbe. Dans TextSnake, une instance de texte est décrite comme une séquence de disques ordonnés et superposés centrés sur des axes symétriques, chacun étant associé à un rayon potentiellement variable et une orientation. Ces attributs géométriques sont estimés via un modèle de réseau neuronal convolutif entièrement convolutionnel (Fully Convolutional Network - FCN). Dans les expériences, le détecteur de texte basé sur TextSnake atteint des performances d'état de l'art ou comparables sur Total-Text et SCUT-CTW1500, deux benchmarks récemment publiés mettant particulièrement l'accent sur le texte courbe dans les images naturelles, ainsi que sur les ensembles de données largement utilisés ICDAR 2015 et MSRA-TD500. Plus précisément, TextSnake surpassent la méthode de base sur Total-Text avec plus de 40% d'amélioration en F-mesure.

TextSnake : Une représentation flexible pour la détection de texte de formes arbitraires | Articles de recherche récents | HyperAI