Ensemble De Données De Reconnaissance De Texte TextOCR
Date
il y a 3 ans
URL de publication
Licence
CC BY 4.0
Catégories

OCR signifie reconnaissance optique de caractères. TextOCR est un ensemble de données utilisé pour détecter et reconnaître du texte dans n'importe quelle scène. TextOCR fournit environ 1 million d'annotations de mots de haute qualité pour les images dans TextVQA et peut effectuer un raisonnement de bout en bout sur des tâches en aval telles que la réponse visuelle aux questions ou le sous-titrage d'images.
L'ensemble de données comprend :
- 28 134 images de l'ensemble de données TextVQA
- 903 096 mots de texte de scène annotés
- En moyenne, chaque image contient 32 mots associés.