WebVision 数据集是一个大规模的网络图像数据集,包含 240 多万张从 Flickr 网站和 Google Image 搜索中爬取的图像。图像的对应文本信息(如:标题、用户标签或描述)也作为额外的元信息提供。该数据集提供一个包含 5 万张图片(每个类别 50 张)的验证集。该数据集可用于促进从噪音网络数据中学习视觉表征的研究。
1,000 个与 ILSVRC 2012 数据集相同的概念被用于搜索图像,使得现有的方法可以直接用于科研,并能够与从 ILSVRC 2012 数据集训练出来的模型进行比较,同时也使得研究大规模场景下的数据集偏差问题成为可能。
该数据集包括 1.0 和 2.0 版本。
做种 1
下载中 0
已完成 280
总下载 455