HyperAIHyperAI

Command Palette

Search for a command to run...

OCRBench-v2-Texterkennungs-Benchmark-Datensatz

Datum

vor 4 Monaten

Größe

6.43 GB

Organisation

Bytedance
Huazhong Universität für Wissenschaft und Technologie
Technische Universität Südchina

Paper-URL

2501.00321

Tags

OCRBench-v2 ist ein multimodaler Benchmark zur Bewertung der optischen Zeichenerkennung (OCR) im Großmaßstab, der 2025 von der Huazhong University of Science and Technology, der South China University of Technology, ByteDance und anderen Institutionen veröffentlicht wurde. Die relevanten Ergebnisse des Papiers sind „OCRBench v2: Ein verbesserter Benchmark zur Bewertung großer multimodaler Modelle zur visuellen Textlokalisierung und -begründung“, dessen Ziel darin besteht, die OCR-Fähigkeiten großer multimodaler Modelle (LMMs) in verschiedenen textbezogenen Aufgaben zu bewerten.

Dieser Datensatz ist ein umfangreiches Upgrade auf Basis von OCRBench. Er enthält 10.000 manuell verifizierte chinesisch-englische Frage-Antwort-Paare als öffentlichen Testsatz sowie einen zusätzlichen privaten Testsatz mit 1.500 manuell annotierten Rich-Text-Bildern aus verschiedenen Quellen, darunter gedruckte Bücher, E-Books, gescannte Dokumente und Webinhalte. Die Daten decken 31 typische Textszenarien und 23 Unteraufgaben ab, die in acht OCR-Kernfunktionen (Texterkennung, Textdetektion, Textreferenzlokalisierung, Beziehungsextraktion, Elementanalyse, mathematische Operationen, visuelles Textverständnis und Wissensschlussfolgerung) kategorisiert sind.

OCRBenchv2.torrent
Seeding 1Wird heruntergeladen 0Abgeschlossen 26Gesamtdownloads 123
  • OCRBenchv2/
    • README.md
      1.81 KB
    • README.txt
      3.62 KB
      • data/
        • OCRBenchv2.zip
          6.43 GB

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp