LAION 多模态数据集

该数据集暂无下载资源提供,我们正在积极的准备提供更多的数据集

LAION 全称 Large-scale Artificial Intelligence Open Network,是一个大规模 AI 开放网络。

包括 3 个数据集

  1. LAION-400M:包含 4 亿英文 image-text pair 的开放数据集,曾是世界上最大的公开可访问的图像-文本数据集;
  2. LAION-5B:包括 58.5 亿个经过 CLIP 过滤的多语言 image-text pair,比 LAION-400M 大 14 倍;
  3. LAION-Aesthetics:由 LAION-5B 几个高清图像子集构成。