HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Référence Pour La Reconnaissance De Texte OCRBench

Date

il y a 6 mois

Size

60.8 MB

Organization

Université des sciences et technologies de Huazhong

Paper URL

arxiv.org

OCRBench est un jeu de données de référence pour la reconnaissance de texte publié par l'Université des sciences et technologies de Huazhong et Microsoft Research. Ce jeu de données constitue un benchmark d'évaluation pour la reconnaissance optique de caractères (OCR) multimodale à grande échelle. Les résultats de l'étude sont les suivants :OCRBench : Sur le mystère caché de l'OCR dans les grands modèles multimodaux", qui vise à évaluer les capacités OCR des grands modèles multimodaux (LMM) dans différentes tâches liées au texte.

L'ensemble de données contient 1 000 paires de questions-réponses sélectionnées et corrigées manuellement à partir de cinq tâches représentatives liées au texte : reconnaissance de texte, centrage du texte de la scène, orientation du document, extraction d'informations clés (KIE) et expressions mathématiques manuscrites (HMER).

Les données comprennent :

  • Reconnaissance de texte 300 images (y compris des types de texte réguliers, irréguliers, artistiques et autres).
  • Scène Texte Centrée Visuelle Réponse à 200 Questions.
  • Questionnaire visuel guidé par document répondant à 200 questions.
  • 200 questions pour extraire des informations clés.
  • Reconnaissance d'expressions mathématiques manuscrites 100 images de l'ensemble de données HME100k.
OCRBench.torrent
Seeding 1Downloading 0Completed 70Total Downloads 224
  • OCRBench/
    • README.md
      1.65 KB
    • README.txt
      3.3 KB
      • data/
        • OCRBench.zip
          60.8 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp