Régression de points sur ligne glissante pour la détection robuste de texte en scène

Les méthodes traditionnelles de détection de texte se concentrent principalement sur le texte en forme de quadrilatère. Dans cette étude, nous proposons une nouvelle méthode nommée régression de points sur ligne glissante (SLPR) afin de détecter du texte de forme arbitraire dans des scènes naturelles. La SLPR régresse plusieurs points sur le bord d'une ligne de texte, puis utilise ces points pour esquisser les contours du texte. La méthode SLPR proposée peut être adaptée à diverses architectures de détection d'objets, telles que Faster R-CNN et R-FCN. Plus précisément, nous générons d'abord la plus petite boîte rectangulaire incluant le texte grâce au réseau de proposition de régions (RPN), puis nous régressons isométriquement les points sur le bord du texte en utilisant des lignes glissantes verticales et horizontales. Pour tirer pleinement parti des informations et réduire la redondance, nous calculons la coordonnée x ou y du point cible en fonction de la position de la boîte rectangulaire, et ne régressons que la coordonnée y restante ou x. Ainsi, non seulement nous pouvons réduire les paramètres du système, mais aussi contrôler les points qui génèrent un polygone plus régulier. Notre approche a obtenu des résultats compétitifs sur le benchmark traditionnel ICDAR2015 Incidental Scene Text et sur l'ensemble de données CTW1500 pour la détection de texte courbe.