HyperAIHyperAI
il y a 2 mois

EAST : Un détecteur de texte en scène efficace et précis

Zhou, Xinyu ; Yao, Cong ; Wen, He ; Wang, Yuzhi ; Zhou, Shuchang ; He, Weiran ; Liang, Jiajun
EAST : Un détecteur de texte en scène efficace et précis
Résumé

Les approches précédentes pour la détection de texte dans les scènes ont déjà obtenu des performances prometteuses sur diverses benchmarks. Cependant, elles échouent généralement lorsqu'elles sont confrontées à des scénarios difficiles, même lorsqu'elles sont équipées de modèles de réseaux neuronaux profonds, car les performances globales sont déterminées par l'interaction entre plusieurs étapes et composants des pipelines. Dans ce travail, nous proposons un pipeline simple mais puissant qui permet une détection rapide et précise du texte dans les scènes naturelles. Ce pipeline prédit directement des mots ou des lignes de texte d'orientations et de formes quadrilatérales arbitraires dans des images complètes, en éliminant les étapes intermédiaires inutiles (par exemple, l'agrégation de candidats et la partition de mots) avec un seul réseau neuronal. La simplicité de notre pipeline permet de concentrer les efforts sur la conception de fonctions de perte et d'architecture de réseau neuronal.Des expériences menées sur des jeux de données standards, tels que ICDAR 2015, COCO-Text et MSRA-TD500, montrent que l'algorithme proposé surpasse significativement les méthodes de pointe en termes de précision et d'efficacité. Sur le jeu de données ICDAR 2015, l'algorithme proposé atteint un score F de 0,7820 à une vitesse de 13,2 images par seconde (fps) en résolution 720p.

EAST : Un détecteur de texte en scène efficace et précis | Articles de recherche récents | HyperAI