Meta-Dataset 小样本学习数据集

日期

9 个月前

机构

Google

发布地址

github.com

许可协议

其他

下载帮助
特色图像

Meta-Dataset 是一个大型的小样本学习基准。该数据集不对小样本任务做限制(不要求必须具备固定的方式及镜头),因此代表了一个更真实的场景。

该数据集由来自不同领域的 10 个数据集组成:

  1. ILSVRC-2012(ImageNet 数据集,由涉及 1,000 个类别的自然图像组成。)
  2. Omniglot(手写字符,包含 1,623 个分类)
  3. Aircraft(飞机图像数据集,包含 100 个分类)
  4. CUB-200-2011(鸟类数据集, 包含 200 个分类)
  5. Describable Textures(不同种类的纹理图像,包含 43 个类别)
  6. Quick Draw(涉及 345 个不同类别的黑白草图)
  7. Fungi(涉及 1,500 个类别的大型蘑菇数据集)
  8. VGG Flower(涉及 102 个类别的花卉图像数据集),
  9. Traffic Signs(德国交通标志图片,包含 43 个类别)
  10. MSCOCO(收集自 Flickr 的图片, 包含 80 个类别)

Meta-Dataset 中 Traffic Sign (GTSRB) 和 COCO 数据集不参与训练,仅用于验证或测试。其余的 8 个数据集大致按照 70% / 15% / 15% 的比例划分训练 / 验证 / 测试集。