Command Palette
Search for a command to run...
OCRBench-Texterkennungs-Benchmark-Datensatz
OCRBench ist ein von der Huazhong University of Science and Technology und Microsoft Research veröffentlichter Benchmark-Datensatz zur Texterkennung. Dieser Datensatz dient als Evaluierungs-Benchmark für multimodale großflächige optische Zeichenerkennung (OCR). Die relevanten Ergebnisse sind:OCRBench: Das verborgene Geheimnis der OCR in großen multimodalen Modellen“, dessen Ziel darin besteht, die OCR-Fähigkeiten großer multimodaler Modelle (LMMs) in verschiedenen textbezogenen Aufgaben zu bewerten.
Der Datensatz enthält 1000 manuell geprüfte und korrigierte Frage-Antwort-Paare aus fünf repräsentativen textbezogenen Aufgaben: Texterkennung, Szenentextzentrierung, Dokumentorientierung, Schlüsselinformationsextraktion (KIE) und handschriftliche mathematische Ausdrücke (HMER).
Die Daten umfassen:
- Texterkennung 300 Bilder (einschließlich normaler, unregelmäßiger, künstlerischer und anderer Textarten).
- Szenentextzentrierte visuelle Fragenbeantwortung mit 200 Fragen.
- Dokumentgestützte visuelle Beantwortung von 200 Fragen.
- 200 Fragen zur Gewinnung wichtiger Informationen.
- Handschriftliche Erkennung mathematischer Ausdrücke, 100 Bilder aus dem HME100k-Datensatz.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.