Command Palette
Search for a command to run...
Régression de point de ligne glissante pour la détection de texte scènique robuste à la forme
Régression de point de ligne glissante pour la détection de texte scènique robuste à la forme
Zhu Yixing Du Jun
Résumé
Les méthodes traditionnelles de détection de texte se concentrent principalement sur le texte en quadrilatère. Dans cette étude, nous proposons une nouvelle méthode, nommée régression par points en ligne glissante (Sliding Line Point Regression, SLPR), afin de détecter le texte de forme arbitraire dans des scènes naturelles. La méthode SLPR régresse plusieurs points situés sur le contour de la ligne de texte, puis utilise ces points pour esquisser les contours du texte. La méthode proposée SLPR peut être intégrée à de nombreuses architectures de détection d'objets, telles que Faster R-CNN et R-FCN. Plus précisément, nous générons d'abord la plus petite boîte rectangulaire contenant le texte à l’aide d’un réseau de proposition de régions (Region Proposal Network, RPN), puis nous effectuons une régression isométrique des points situés sur le contour du texte en utilisant des lignes glissantes verticales et horizontales. Afin d’exploiter pleinement les informations disponibles et de réduire la redondance, nous calculons la coordonnée x ou y du point cible en fonction de la position de la boîte rectangulaire, et ne régressons que la coordonnée restante (y ou x). Cette approche permet non seulement de réduire le nombre de paramètres du système, mais aussi de limiter la formation de polygones trop réguliers. Notre méthode obtient des résultats compétitifs sur le benchmark classique ICDAR2015 pour le texte en scène incidente ainsi que sur le jeu de données de détection de texte courbé CTW1500.