HyperAI

TextOCR-Texterkennungsdatensatz

Datum

vor 3 Jahren

Organisation

Veröffentlichungs-URL

textvqa.org

Lizenz

CC BY 4.0

Kategorien

Download-Hilfe
特色图像

OCR steht für optische Zeichenerkennung. TextOCR ist ein Datensatz, der zum Erkennen und Erkennen von Text in jeder Szene verwendet wird. TextOCR bietet etwa 1 Million hochwertige Wortanmerkungen für Bilder in TextVQA und kann End-to-End-Schlussfolgerungen für nachgelagerte Aufgaben wie die Beantwortung visueller Fragen oder die Beschriftung von Bildern durchführen.

Der Datensatz umfasst:

  • 28.134 Bilder aus dem TextVQA-Datensatz
  • 903.096 kommentierte Szenentextwörter
  • Im Durchschnitt sind zu jedem Bild 32 Wörter vorhanden.