
摘要
尽管深度学习在众多实际计算机视觉任务中已取得成功应用,但训练鲁棒的分类器通常需要大量标注良好的数据。然而,数据标注往往成本高昂且耗时。为此,少样本图像分类(few-shot image classification)应运而生,旨在仅利用有限数量的标注样本,即可有效训练模型以识别新类别。近年来,基于可迁移度量学习(transferable metric learning)的方法通过学习查询集(query set)与支持集(support set)样本特征之间的相似性,取得了令人瞩目的分类性能。然而,这些方法大多未显式考虑模型的可解释性,而这种可解释性实际上可以在训练过程中得以揭示。针对这一问题,本文提出一种基于度量学习的方法——区域对比网络(Region Comparison Network, RCN),该方法不仅能揭示少样本学习在神经网络中的工作机制,还能识别出来自查询集与支持集图像中相互关联的具体视觉区域。此外,我们进一步提出一种名为区域激活映射(Region Activation Mapping, RAM)的可视化策略,通过直观展示网络中间变量,解释RCN模型所学习到的特征表示。我们还提出一种新的可解释性泛化方法,能够将解释能力从任务层面拓展至类别层面,该方法也可被视为用于识别支持RCN最终决策的典型视觉组成部分(prototypical parts)的有效手段。在四个基准数据集上的大量实验结果充分验证了所提方法相较于现有基线方法的优越性。