RedCaps の画像とテキストのペア データセット

RedCaps は大規模な画像とテキストのペアのデータ セットで、データは Reddit から取得されており、合計 120 万件あります。写真とテキストは、さまざまなオブジェクトやシーンを説明します。
データは人間が厳選した一連のサブレディットから収集されたもので、粗い画像ラベルが提供され、個々のインスタンスにラベルを付けることなくデータセットの構成に関するガイダンスが可能になります。
ミシガン大学のチームがデータセットを公開した。
RedCaps.torrent
シーディング 2ダウンロード中 1ダウンロード完了 647総ダウンロード数 693