Command Palette

Search for a command to run...

CapsFusion-120M 多模态图文数据集

日期

1 年前

大小

23.21 GB

机构

清华大学

发布地址

github.com

论文链接

arxiv.org

Featured Image

该数据集是清华大学和 BAAI 于 2024 年推出的多模态图文数据集。论文成果 「CapsFusion: Rethinking Image-Text Data at Scale」已被 CVPR 2024 收录。

该数据集可用于大规模多模态预训练的高质量资源。此版本包含来自 LAION-2B 和 LAION-COCO 数据集的相应字幕,便于进行比较分析和进一步深入研究图像文本数据的质量。

每个数据条目有四个字段:

  • 图片网址
  • LAION-2B 标题(来自网络的原始替代文本)
  • LAION-COCO 字幕(由 BLIP 合成)
  • CapsFusion 标题(研究团队的)
CapsFusion-120M.torrent
做种 2正在下载 0已完成 154总下载次数 293
  • CapsFusion-120M/
    • README.md
      1.34 KB
    • README.txt
      2.69 KB
      • data/
        • CapsFusion-120M.zip
          23.21 GB

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供