CapsFusion-120M マルチモーダル グラフィックおよびテキスト データ セット

このデータ セットは、清華大学と BAAI によって 2024 年に開始されたマルチモーダル グラフィックおよびテキスト データ セットです。論文結果 「CapsFusion: 大規模な画像テキスト データの再考」CVPR 2024 に含まれています。
このデータセットは、大規模なマルチモーダル事前トレーニング用の高品質リソースとして使用できます。このリリースには、LAION-2B および LAION-COCO データセットからの対応するキャプションが含まれており、比較分析と画像テキスト データの品質のさらに詳細な研究が可能になります。
各データエントリには次の 4 つのフィールドがあります。
- 画像URL
- LAION-2B タイトル (Web からのオリジナルの代替テキスト)
- LAION-COCO字幕(BLIP合成)
- CapsFusion ヘッダー (研究チームのもの)
CapsFusion-120M.torrent
シーディング 2ダウンロード中 1ダウンロード完了 79総ダウンロード数 148