Datum

vor 9 Monaten

Größe

6.43 GB

Organisation

Paper-URL

2501.00321

Tags

OCR

OCRBench-v2 ist ein multimodaler Benchmark zur Bewertung der optischen Zeichenerkennung (OCR) im Großmaßstab, der 2025 von der Huazhong University of Science and Technology, der South China University of Technology, ByteDance und anderen Institutionen veröffentlicht wurde. Die relevanten Ergebnisse des Papiers sind „OCRBench v2: Ein verbesserter Benchmark zur Bewertung großer multimodaler Modelle zur visuellen Textlokalisierung und -begründung“, dessen Ziel darin besteht, die OCR-Fähigkeiten großer multimodaler Modelle (LMMs) in verschiedenen textbezogenen Aufgaben zu bewerten. Dieser Datensatz ist ein umfangreiches Upgrade auf Basis von OCRBench. Er enthält 10.000 manuell verifizierte chinesisch-englische Frage-Antwort-Paare als öffentlichen Testsatz sowie einen zusätzlichen privaten Testsatz mit 1.500 manuell annotierten Rich-Text-Bildern aus verschiedenen Quellen, darunter gedruckte Bücher, E-Books, gescannte Dokumente und Webinhalte. Die Daten decken 31 typische Textszenarien und 23 Unteraufgaben ab, die in acht OCR-Kernfunktionen (Texterkennung, Textdetektion, Textreferenzlokalisierung, Beziehungsextraktion, Elementanalyse, mathematische Operationen, visuelles Textverständnis und Wissensschlussfolgerung) kategorisiert sind.

OCRBenchv2.torrent

Seeding 2Wird heruntergeladen 0Abgeschlossen 38Gesamtdownloads 159

OCRBenchv2/
- README.md
  1.81 KB
- README.txt
  3.62 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor 9 Monaten

Größe

6.43 GB

Organisation

Paper-URL

2501.00321

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

vor 2 Monaten

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

vor 4 Monaten

THINGS-EEG EEG-Datensatz

vor 5 Monaten

THINGS-MEG-Magnetoenzephalographie-Datensatz

vor 5 Monaten

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

vor 5 Monaten

CL-bench Context Learning Evaluation Benchmark-Datensatz

vor 4 Monaten

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

vor 5 Monaten

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

vor 5 Monaten

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

vor 6 Monaten

MCIF Multimodal Cross-Language Instruction Following Dataset

vor 6 Monaten

TxT360-3efforts Multi-Task Inference Dataset

vor 6 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

OCRBench-v2-Texterkennungs-Benchmark-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

OCRBench-v2-Texterkennungs-Benchmark-Datensatz

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

CL-bench Context Learning Evaluation Benchmark-Datensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

OCRBench-v2-Texterkennungs-Benchmark-Datensatz

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

CL-bench Context Learning Evaluation Benchmark-Datensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

CL-bench Context Learning Evaluation Benchmark-Datensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

CL-bench Context Learning Evaluation Benchmark-Datensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset