Meta-Dataset 是一个大型的小样本学习基准。该数据集不对小样本任务做限制(不要求必须具备固定的方式及镜头),因此代表了一个更真实的场景。
该数据集由来自不同领域的 10 个数据集组成:
- ILSVRC-2012(ImageNet 数据集,由涉及 1,000 个类别的自然图像组成。)
- Omniglot(手写字符,包含 1,623 个分类)
- Aircraft(飞机图像数据集,包含 100 个分类)
- CUB-200-2011(鸟类数据集, 包含 200 个分类)
- Describable Textures(不同种类的纹理图像,包含 43 个类别)
- Quick Draw(涉及 345 个不同类别的黑白草图)
- Fungi(涉及 1,500 个类别的大型蘑菇数据集)
- VGG Flower(涉及 102 个类别的花卉图像数据集),
- Traffic Signs(德国交通标志图片,包含 43 个类别)
- MSCOCO(收集自 Flickr 的图片, 包含 80 个类别)
Meta-Dataset 中 Traffic Sign (GTSRB) 和 COCO 数据集不参与训练,仅用于验证或测试。其余的 8 个数据集大致按照 70% / 15% / 15% 的比例划分训练 / 验证 / 测试集。