HyperAI超神经

CapsFusion-120M 多模态图文数据集

日期

1 年前

大小

23.21 GB

机构

清华大学

发布地址

github.com

特色图像

该数据集是清华大学和 BAAI 于 2024 年推出的多模态图文数据集。论文成果 「CapsFusion: Rethinking Image-Text Data at Scale」已被 CVPR 2024 收录。

该数据集可用于大规模多模态预训练的高质量资源。此版本包含来自 LAION-2B 和 LAION-COCO 数据集的相应字幕,便于进行比较分析和进一步深入研究图像文本数据的质量。

每个数据条目有四个字段:

  • 图片网址
  • LAION-2B 标题(来自网络的原始替代文本)
  • LAION-COCO 字幕(由 BLIP 合成)
  • CapsFusion 标题(研究团队的)
CapsFusion-120M.torrent
做种 1正在下载 1已完成 79总下载次数 148
  • CapsFusion-120M/
    • README.md
      1.34 KB
    • README.txt
      2.69 KB
      • data/
        • CapsFusion-120M.zip
          23.21 GB