HyperAIHyperAI
il y a 2 mois

FOTS : Détection Rapide de Texte Orienté avec un Réseau Unifié

Xuebo Liu; Ding Liang; Shi Yan; Dagui Chen; Yu Qiao; Junjie Yan
FOTS : Détection Rapide de Texte Orienté avec un Réseau Unifié
Résumé

La détection de texte incident est considérée comme l'un des défis les plus difficiles et précieux dans la communauté d'analyse de documents. La plupart des méthodes existantes traitent la détection et la reconnaissance du texte comme deux tâches distinctes. Dans ce travail, nous proposons un réseau Fast Oriented Text Spotting (FOTS) unifié et entièrement entraînable en fin à fin pour une détection et une reconnaissance simultanées, partageant le calcul et les informations visuelles entre ces deux tâches complémentaires. Plus précisément, RoIRotate est introduit pour partager les caractéristiques convolutives entre la détection et la reconnaissance. Grâce à cette stratégie de partage convolutif, notre FOTS présente peu de surcoût en termes de calcul par rapport au réseau de base pour la détection du texte, et la méthode d'entraînement conjoint apprend des caractéristiques plus génériques qui permettent à notre méthode de surpasser ces méthodes en deux étapes. Les expériences menées sur les jeux de données ICDAR 2015, ICDAR 2017 MLT et ICDAR 2013 montrent que la méthode proposée dépasse significativement les méthodes de pointe actuelles, ce qui nous permet d'élaborer le premier système de détection de texte orienté en temps réel qui surpasse tous les résultats précédents d'au moins 5% sur la tâche de détection de texte ICDAR 2015 tout en maintenant une fréquence d'images de 22,6 images par seconde (fps).

FOTS : Détection Rapide de Texte Orienté avec un Réseau Unifié | Articles de recherche récents | HyperAI