HyperAIHyperAI

Command Palette

Search for a command to run...

OCRBench-Texterkennungs-Benchmark-Datensatz

Datum

vor 4 Monaten

Größe

60.8 MB

Organisation

Huazhong Universität für Wissenschaft und Technologie

Paper-URL

arxiv.org

OCRBench ist ein von der Huazhong University of Science and Technology und Microsoft Research veröffentlichter Benchmark-Datensatz zur Texterkennung. Dieser Datensatz dient als Evaluierungs-Benchmark für multimodale großflächige optische Zeichenerkennung (OCR). Die relevanten Ergebnisse sind:OCRBench: Das verborgene Geheimnis der OCR in großen multimodalen Modellen“, dessen Ziel darin besteht, die OCR-Fähigkeiten großer multimodaler Modelle (LMMs) in verschiedenen textbezogenen Aufgaben zu bewerten.

Der Datensatz enthält 1000 manuell geprüfte und korrigierte Frage-Antwort-Paare aus fünf repräsentativen textbezogenen Aufgaben: Texterkennung, Szenentextzentrierung, Dokumentorientierung, Schlüsselinformationsextraktion (KIE) und handschriftliche mathematische Ausdrücke (HMER).

Die Daten umfassen:

  • Texterkennung 300 Bilder (einschließlich normaler, unregelmäßiger, künstlerischer und anderer Textarten).
  • Szenentextzentrierte visuelle Fragenbeantwortung mit 200 Fragen.
  • Dokumentgestützte visuelle Beantwortung von 200 Fragen.
  • 200 Fragen zur Gewinnung wichtiger Informationen.
  • Handschriftliche Erkennung mathematischer Ausdrücke, 100 Bilder aus dem HME100k-Datensatz.
OCRBench.torrent
Seeding 1Herunterladen 0Abgeschlossen 67Gesamtdownloads 169
  • OCRBench/
    • README.md
      1.65 KB
    • README.txt
      3.3 KB
      • data/
        • OCRBench.zip
          60.8 MB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
OCRBench-Texterkennungs-Benchmark-Datensatz | Datensätze | HyperAI