日期
机构
发布地址
textvqa.org
许可协议
CC BY 4.0
标签
光学字符识别
场景文本检测
场景文本识别
分类
文本识别
OCR 全称 optical character recognition,TextOCR 是用于对任意场景文本进行检测和识别的数据集。 TextOCR 为 TextVQA 中的图像提供了约 100 万个高质量的词汇标注,并且能在视觉问答或图像说明等下游任务上实行端到端的推理。
该数据集包括: