Command Palette
Search for a command to run...
TextOCR-Texterkennungsdatensatz
Datum
Veröffentlichungs-URL
Paper-URL
Lizenz
CC BY 4.0

OCR steht für optische Zeichenerkennung. TextOCR ist ein Datensatz, der zum Erkennen und Erkennen von Text in jeder Szene verwendet wird. TextOCR bietet etwa 1 Million hochwertige Wortanmerkungen für Bilder in TextVQA und kann End-to-End-Schlussfolgerungen für nachgelagerte Aufgaben wie die Beantwortung visueller Fragen oder die Beschriftung von Bildern durchführen.
Der Datensatz umfasst:
- 28.134 Bilder aus dem TextVQA-Datensatz
- 903.096 kommentierte Szenentextwörter
- Im Durchschnitt sind zu jedem Bild 32 Wörter vorhanden.
KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.