LAION-SG 大規模高画質画像理解データセット
LAION-SG は、浙江大学、江南大学、北京大学、アリババ グループ、アント グループによって 2024 年に構築された大規模な高品質画像理解データセットです。関連する論文結果は「」です。LAION-SG: 構造注釈を備えた複雑な画像テキスト モデルをトレーニングするための強化された大規模データセット”。 LAION-SG には、オブジェクト、属性、関係性が注釈付けされた 540,005 個のシーン グラフと画像のペアが含まれており、トレーニング、検証、テスト セットに分割されています。データセットの画像は LAION-Aesthetics V2 (6.5+) データセットから取得され、注釈プロセスでは自動注釈に GPT-4o が使用されます。
オリジナルの LAION-Aesthetics データセットと比較して、LAION-SG の平均アノテーション長と精度が向上しています。このデータセットの各サンプルには平均 6.39 個のオブジェクトが含まれており、抽象的な固有名詞を除外すると、オブジェクト情報は 216% まで増加します。
LAION-SG データセットは、画像説明の生成、視覚的質問応答システム、画像検索などのタスクを含む、画像とテキストのさまざまなクロスモーダル研究分野に適しています。これらのタスクはすべて、深い理解と意味解析に依存しています。画像コンテンツの。

LAION-SG.torrent
シーディング 3ダウンロード中 0ダウンロード完了 46総ダウンロード数 100