2 个月前

用于少样本分类的传导解耦变分推断

Anuj Singh; Hadi Jamali-Rad
用于少样本分类的传导解耦变分推断
摘要

从少量样本中学习的能力是人类智能的标志。少样本学习旨在将这一能力扩展到机器上。受概率深度学习的潜力和力量的启发,我们提出了一种新颖的变分推断网络(命名为TRIDENT),用于少样本分类,该网络可以将图像表示解耦为语义和标签潜在变量,并以交织的方式同时推断它们。为了引入任务感知能力,作为TRIDENT推断机制的一部分,我们利用了一个新颖的内置注意力机制传导特征提取模块(称为AttFEX),在少样本任务中跨查询图像和支持图像提取信息。我们的大量实验结果验证了TRIDENT的有效性,并表明即使使用最简单的骨干网络,它在常用的miniImageNet和tieredImageNet数据集上也达到了新的最先进水平(分别提高了4%和5%),并且在最近具有挑战性的跨域miniImageNet → CUB场景中显著超越了现有的最佳跨域基线模型(最高提升了20%)。代码和实验细节可以在我们的GitHub仓库中找到:https://github.com/anujinho/trident