
摘要
从有限数据中学习,即小样本学习(Few-Shot Learning),是一项具有挑战性的计算机视觉任务。许多研究工作利用语义信息并设计复杂的语义融合机制来弥补受限数据中代表性特征的不足。然而,依赖简单的语义信息(如类别名称)会因为其简短而引入偏差,而从外部知识获取广泛的语义信息则需要巨大的时间和努力。这一限制严重制约了语义在小样本学习中的潜力。本文设计了一种称为“语义进化”(Semantic Evolution)的自动方法来生成高质量的语义信息。通过引入高质量的语义信息,可以减少对复杂网络结构和学习算法的需求,这些复杂结构和算法在以往的工作中被广泛使用。因此,我们采用了一个简单的两层网络,称为“语义对齐网络”(Semantic Alignment Network),用于将语义信息和视觉特征转换为具有丰富区分特征的鲁棒类原型,以进行小样本分类。实验结果表明,我们的框架在六个基准测试上均优于所有先前的方法,证明了简单网络结合高质量语义信息可以在小样本分类任务中胜过复杂的多模态模块。代码可在 https://github.com/zhangdoudou123/SemFew 获取。