HyperAIHyperAI

Ensemble De Données De Reconnaissance De Texte TextOCR

Date

il y a 3 ans

Organisation

URL de publication

textvqa.org

URL de l'article

arxiv.org

Licence

CC BY 4.0

Aide au téléchargement
特色图像

OCR signifie reconnaissance optique de caractères. TextOCR est un ensemble de données utilisé pour détecter et reconnaître du texte dans n'importe quelle scène. TextOCR fournit environ 1 million d'annotations de mots de haute qualité pour les images dans TextVQA et peut effectuer un raisonnement de bout en bout sur des tâches en aval telles que la réponse visuelle aux questions ou le sous-titrage d'images.

L'ensemble de données comprend :

  • 28 134 images de l'ensemble de données TextVQA
  • 903 096 mots de texte de scène annotés
  • En moyenne, chaque image contient 32 mots associés.
Ensemble De Données De Reconnaissance De Texte TextOCR | Ensembles de données | HyperAI