
摘要
少样本分类旨在仅凭借少量样本识别未见类别。本文研究多域少样本图像分类问题,其中未见类别及其样本来自多样化的数据源。该问题近年来受到广泛关注,并推动了如Meta-Dataset等基准数据集的建立。在多域设置中,一个关键挑战是如何有效融合来自不同训练域的特征表示。为此,我们提出一种通用表示Transformer(Universal Representation Transformer, URT)层,该层通过元学习机制,动态地重新加权并组合最适配的域特定特征表示,从而利用通用特征实现少样本分类。实验结果表明,URT在Meta-Dataset基准上取得了新的最先进性能,尤其在支持的数据源数量方面显著优于现有方法,展现出卓越的跨域泛化能力。我们进一步分析了URT的多种变体,并通过注意力得分热力图可视化,深入揭示了模型实现跨域泛化的工作机制。相关代码已开源,地址为:https://github.com/liulu112601/URT。