IIIT 全称 International Institute of Information Technology,IIIT-ILST 是关于三种印度语言(Devanagari、Telugu 和 Malayalam)的场景文本识别数据集。IIIT-ILST 的每个脚本包含近 1 千张真实图像,这些图像有场景文本边界框和转录的标注。
IIIT-ILST 场景文本识别数据集
本站暂不支持该数据集下载,如需下载请访问上述「发布地址」进行下载(如可用)
感谢您下载 IIIT-ILST 场景文本识别数据集!
本站基于知识共享许可协议,为国内用户提供公开数据集高速下载,仅用于科研与学术交流。
获得数据集更新通知、下载过程发现问题、提供未引入数据集资源等,请关注公众号与我们沟通。
感谢您下载 IIIT-ILST 场景文本识别数据集!

相关数据集推荐
HumanAct 12 三维人体动作图像数据集
这是一个新型三维人体动作图像数据集,图像选自极坐标图像和三维姿势数据集 PHSPD,具有适当的时间裁剪和动作标注。该数据集有 1,191 个三维动作片段,90,099 个姿势,这些动作被分为 12 个动作类别和 34 个细化的子类别。动作类型包括日常运动,如走、跑、坐、跳、热身等…

MEIR 多模态实体图像再利用数据集
MEIR 全称 Multimodal Entity Image Repurposing,是关于图像再利用检测研究的数据集,比之前相类似的数据集更具有挑战性。该数据集包含对真实数据进行位置、人物和组织的操作,这些数据源于 Flicker。

METU Trademark 商标图像数据集
METU 全称 Middle East Technical University,METU Trademark 是一个大型商标图像数据集,包含 923,343 张不同类型的商标图像(仅有文字的商标、仅有图像的商标、文字和图形组合商标)。截至 2014 年,它是最大的公开可用的商标…
