TextOCR 文本识别数据集 机构 Facebook AI Research 发布地址 textvqa.org 论文地址 arxiv.org 分类 文本识别 许可协议 CC BY 4.0 发布日期 11 个月前 标签 光学字符识别、场景文本检测、场景文本识别 暂无下载 本站暂不支持该数据集下载,如需下载请访问上述「发布地址」进行下载(如可用) 感谢您下载 TextOCR 文本识别数据集! 本站基于知识共享许可协议,为国内用户提供公开数据集高速下载,仅用于科研与学术交流。 获得数据集更新通知、下载过程发现问题、提供未引入数据集资源等,请关注公众号与我们沟通。 感谢您下载 TextOCR 文本识别数据集! 点击前往百度网盘下载页面 本站基于知识共享许可协议,为国内用户提供公开数据集高速下载,仅用于科研与学术交流。 关注公众号,获取数据集更新、人工智能相关的最新资讯 OCR 全称 optical character recognition,TextOCR 是用于对任意场景文本进行检测和识别的数据集。TextOCR 为 TextVQA 中的图像提供了约 100 万个高质量的词汇标注,并且能在视觉问答或图像说明等下游任务上实行端到端的推理。 该数据集包括: 28,134 张来自 TextVQA 数据集的图像903,096 个带有标注的场景文本词平均每张图像带有 32 个相关词 相关数据集推荐 Kuzushiji-Kanji 汉字数据集 5 个月前 Kuzushiji-Kanji 是一个含有 3,832个汉字(Kanji)字符的不平衡数据集,并且包含了一些极少数、极稀有的样例。Kuzushiji-kanji 共有 3,832 个类(140,426 幅图像),从每个类有 1,766 个例子到每个类只有一个例子。Kuzushij… ICDAR 2017 场景文本检测数据集 11 个月前 ICDAR 全称 International Conference on Document Analysis and Recognition,是一个专注于文本识别、基于视频的文本分析的国际性的会议。自2003年开始,ICDAR设立了和会议同名的竞赛,该竞赛成了检测自然场景、视频等… IIIT-ILST 场景文本识别数据集 11 个月前 IIIT 全称 International Institute of Information Technology,IIIT-ILST 是关于三种印度语言(Devanagari、Telugu 和 Malayalam)的场景文本识别数据集。IIIT-ILST 的每个脚本包含近 1 …