TextOCR 文本识别数据集 机构 Facebook AI Research 发布地址 textvqa.org 论文地址 arxiv.org 分类 文本识别 许可协议 CC BY 4.0 发布日期 3 个月前 标签 光学字符识别、场景文本检测、场景文本识别 暂无下载 本站暂不支持该数据集下载,如需下载请访问上述「发布地址」进行下载(如可用) 感谢您下载 TextOCR 文本识别数据集! 本站基于知识共享许可协议,为国内用户提供公开数据集高速下载,仅用于科研与学术交流。 获得数据集更新通知、下载过程发现问题、提供未引入数据集资源等,请关注公众号与我们沟通。 感谢您下载 TextOCR 文本识别数据集! 点击前往百度网盘下载页面 本站基于知识共享许可协议,为国内用户提供公开数据集高速下载,仅用于科研与学术交流。 关注公众号,获取数据集更新、人工智能相关的最新资讯 OCR 全称 optical character recognition,TextOCR 是用于对任意场景文本进行检测和识别的数据集。TextOCR 为 TextVQA 中的图像提供了约 100 万个高质量的词汇标注,并且能在视觉问答或图像说明等下游任务上实行端到端的推理。 该数据集包括: 28,134 张来自 TextVQA 数据集的图像903,096 个带有标注的场景文本词平均每张图像带有 32 个相关词 相关数据集推荐 ICDAR 2017 场景文本检测数据集 3 个月前 ICDAR 全称 International Conference on Document Analysis and Recognition,是一个专注于文本识别、基于视频的文本分析的国际性的会议。自2003年开始,ICDAR设立了和会议同名的竞赛,该竞赛成了检测自然场景、视频等… IIIT-ILST 场景文本识别数据集 3 个月前 IIIT 全称 International Institute of Information Technology,IIIT-ILST 是关于三种印度语言(Devanagari、Telugu 和 Malayalam)的场景文本识别数据集。IIIT-ILST 的每个脚本包含近 1 … Kuzushiji-Kanji 汉字数据集 4 个月前 Kuzushiji-Kanji 是一个含有 3,832个汉字(Kanji)字符的不平衡数据集,并且包含了一些极少数、极稀有的样例。Kuzushiji-kanji 共有 3,832 个类(140,426 幅图像),从每个类有 1,766 个例子到每个类只有一个例子。Kuzushij…