TextOCR-Texterkennungsdatensatz
Datum
vor 3 Jahren
Veröffentlichungs-URL
Lizenz
CC BY 4.0
Kategorien

OCR steht für optische Zeichenerkennung. TextOCR ist ein Datensatz, der zum Erkennen und Erkennen von Text in jeder Szene verwendet wird. TextOCR bietet etwa 1 Million hochwertige Wortanmerkungen für Bilder in TextVQA und kann End-to-End-Schlussfolgerungen für nachgelagerte Aufgaben wie die Beantwortung visueller Fragen oder die Beschriftung von Bildern durchführen.
Der Datensatz umfasst:
- 28.134 Bilder aus dem TextVQA-Datensatz
- 903.096 kommentierte Szenentextwörter
- Im Durchschnitt sind zu jedem Bild 32 Wörter vorhanden.