WebVision データセットは、Flickr Web サイトと Google 画像検索からクロールされた 240 万以上の画像を含む大規模な Web 画像データセットです。画像の対応するテキスト情報 (タイトル、ユーザータグ、説明など) も追加のメタ情報として提供されます。このデータセットは、50,000 枚の画像 (カテゴリごとに 50 枚) を含む検証セットを提供します。このデータセットは、ノイズの多いネットワーク データから視覚表現を学習する研究を促進するために使用できます。
ILSVRC 2012 データセットと同じ概念が 1,000 個使用されて画像の検索が行われるため、既存の手法を科学研究に直接適用でき、ILSVRC 2012 データセットからトレーニングされたモデルとの比較が可能になると同時に、大規模なシナリオの研究も可能になります。セットバイアスが可能となります。
このデータ セットにはバージョン 1.0 と 2.0 が含まれています。
做种 1
下载中 1
已完成 296
总下载 470