OCRBench-Texterkennungs-Benchmark-Datensatz
Datum
vor 2 Tagen
Größe
60.8 MB
Veröffentlichungs-URL
Kategorien
OCRBench ist ein von der Huazhong University of Science and Technology und Microsoft Research veröffentlichter Benchmark-Datensatz zur Texterkennung. Dieser Datensatz dient als Evaluierungs-Benchmark für multimodale großflächige optische Zeichenerkennung (OCR). Die relevanten Ergebnisse sind:OCRBench: Das verborgene Geheimnis der OCR in großen multimodalen Modellen“, dessen Ziel darin besteht, die OCR-Fähigkeiten großer multimodaler Modelle (LMMs) in verschiedenen textbezogenen Aufgaben zu bewerten.
该数据集包含 1000 个手动筛选和校正的问答对,这些问答对来自 5 项具有代表性的文本相关任务:文本识别、场景文本中心、文档导向、关键信息(KIE)和手写数学表达式(HMER)。
Die Daten umfassen:
- Texterkennung 300 Bilder (einschließlich normaler, unregelmäßiger, künstlerischer und anderer Textarten).
- Szenentextzentrierte visuelle Fragenbeantwortung mit 200 Fragen.
- Dokumentgestützte visuelle Beantwortung von 200 Fragen.
- 200 Fragen zur Gewinnung wichtiger Informationen.
- Handschriftliche Erkennung mathematischer Ausdrücke, 100 Bilder aus dem HME100k-Datensatz.
OCRBench.torrent
Seeding 1Herunterladen 0Abgeschlossen 0Gesamtdownloads 1