HyperAIHyperAI

Command Palette

Search for a command to run...

OCRBench-Texterkennungs-Benchmark-Datensatz

Date

vor 6 Monaten

Size

60.8 MB

Organization

Huazhong Universität für Wissenschaft und Technologie

Paper URL

arxiv.org

OCRBench ist ein von der Huazhong University of Science and Technology und Microsoft Research veröffentlichter Benchmark-Datensatz zur Texterkennung. Dieser Datensatz dient als Evaluierungs-Benchmark für multimodale großflächige optische Zeichenerkennung (OCR). Die relevanten Ergebnisse sind:OCRBench: Das verborgene Geheimnis der OCR in großen multimodalen Modellen“, dessen Ziel darin besteht, die OCR-Fähigkeiten großer multimodaler Modelle (LMMs) in verschiedenen textbezogenen Aufgaben zu bewerten.

Der Datensatz enthält 1000 manuell geprüfte und korrigierte Frage-Antwort-Paare aus fünf repräsentativen textbezogenen Aufgaben: Texterkennung, Szenentextzentrierung, Dokumentorientierung, Schlüsselinformationsextraktion (KIE) und handschriftliche mathematische Ausdrücke (HMER).

Die Daten umfassen:

  • Texterkennung 300 Bilder (einschließlich normaler, unregelmäßiger, künstlerischer und anderer Textarten).
  • Szenentextzentrierte visuelle Fragenbeantwortung mit 200 Fragen.
  • Dokumentgestützte visuelle Beantwortung von 200 Fragen.
  • 200 Fragen zur Gewinnung wichtiger Informationen.
  • Handschriftliche Erkennung mathematischer Ausdrücke, 100 Bilder aus dem HME100k-Datensatz.
OCRBench.torrent
Seeding 1Downloading 0Completed 70Total Downloads 224
  • OCRBench/
    • README.md
      1.65 KB
    • README.txt
      3.3 KB
      • data/
        • OCRBench.zip
          60.8 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp