HyperAI超神经

SA-Text 图像文本数据集

下载帮助

SA-Text 是由韩国科学技术院联合高丽大学发布的一个高质量场景图像的大规模基准数据集,专为文本感知图像恢复(TAIR)任务设计,相关论文成果为:「Text-Aware Image Restoration with Diffusion Models」。

该数据集包含 105,330 张高分辨率场景图像,并配有多边形级别的文本标注,能够准确地描述文本在图像中的位置和形状,为 TAIR 任务提供了精确的监督信息,使模型能够更好地理解文本在图像中的位置和结构。