CapsFusion-120M 多模态图文数据集

该数据集是清华大学和 BAAI 于 2024 年推出的多模态图文数据集。论文成果 「CapsFusion: Rethinking Image-Text Data at Scale」已被 CVPR 2024 收录。
该数据集可用于大规模多模态预训练的高质量资源。此版本包含来自 LAION-2B 和 LAION-COCO 数据集的相应字幕,便于进行比较分析和进一步深入研究图像文本数据的质量。
每个数据条目有四个字段:
- 图片网址
- LAION-2B 标题(来自网络的原始替代文本)
- LAION-COCO 字幕(由 BLIP 合成)
- CapsFusion 标题(研究团队的)
CapsFusion-120M.torrent
做种 1正在下载 1已完成 79总下载次数 148