HyperAIHyperAI
il y a 2 mois

Réseaux de Normalisation Géométrique pour la Détection Précise du Texte dans les Scènes

Youjiang Xu; Jiaqi Duan; Zhanghui Kuang; Xiaoyu Yue; Hongbin Sun; Yue Guan; Wayne Zhang
Réseaux de Normalisation Géométrique pour la Détection Précise du Texte dans les Scènes
Résumé

Les grandes variations géométriques (par exemple, l'orientation) constituent les principaux défis dans la détection de texte en scène. Dans cette étude, nous menons d'abord des expérimentations pour évaluer la capacité des réseaux à apprendre ces variations géométriques lors de la détection de texte en scène, et nous constatons que les réseaux ne peuvent gérer que des variations géométriques limitées du texte. Ensuite, nous proposons un nouveau module de normalisation géométrique (GNM) à plusieurs branches, chacune composée d'une unité de normalisation d'échelle et d'une unité de normalisation d'orientation, afin de normaliser chaque instance de texte à une plage géométrique canonique souhaitée via au moins une branche. Le GNM est générique et peut être facilement intégré aux détecteurs de texte basés sur les réseaux neuronaux convolutifs existants pour constituer des réseaux de normalisation géométrique (GNNets) fonctionnant d'un bout à l'autre. De plus, nous introduisons un schéma d'entraînement sensible à la géométrie qui permet d'entraîner efficacement les GNNets en échantillonnant et en augmentant les instances de texte issues d'une distribution uniforme de variations géométriques. Enfin, des expériences réalisées sur les benchmarks populaires ICDAR 2015 et ICDAR 2017 MLT montrent que notre méthode surpassent remarquablement toutes les approches actuelles en obtenant des scores F mono-avancés respectivement de 88,52 et 74,54.

Réseaux de Normalisation Géométrique pour la Détection Précise du Texte dans les Scènes | Articles de recherche récents | HyperAI