Aesthetic Visual Analysis 美学图像评估数据集

这是一个用于图像审美评估的数据集,包含 25 万多张图像以及丰富的元数据。该数据集共有66类语义标注以及 14 类摄影风格标注,每张图像均有美学评分。相较于现有的数据集,该数据集在标注的规模、多样性和异质性方面具有优势,可用于研究审美偏好计算模型。

MLe2e 文本识别数据集

MLe2e 全称 Multi-Language end-to-end,用于评估场景文本端到端阅读系统,以及所有中间阶段,如文本检测、脚本识别和文本识别。该数据集共包含 711 个场景图像,涵盖四种不同的语言(拉丁文、中文、卡纳达文和韩文)。