3 个月前

基于推理的隐式语义数据增强:面向长尾分类的推理驱动方法

Xiaohua Chen, Yucan Zhou, Dayan Wu, Wanqian Zhang, Yu Zhou, Bo Li, Weiping Wang
基于推理的隐式语义数据增强:面向长尾分类的推理驱动方法
摘要

现实世界中的数据通常呈现长尾分布,这导致现有分类算法的性能显著下降。其核心问题在于,尾部类别中的样本难以充分表征类内多样性。人类即使首次接触某一类别,也能凭借先验知识想象该类样本在不同姿态、场景和视角下的形态。受此启发,我们提出一种基于推理的隐式语义数据增强方法,通过借鉴其他类别所蕴含的变换方向来生成新样本。由于每个类别的协方差矩阵能够表征其特征变换方向,我们可从语义相似的类别中采样新的变换方向,从而生成具有显著差异性的新实例。具体而言,首先利用长尾分布数据训练一个主干网络和分类器;随后,估计每个类别的协方差矩阵,并构建知识图谱以存储任意两类之间的语义关系;最后,通过知识图谱中所有相似类别传播信息,对尾部样本进行自适应增强。在CIFAR-100-LT、ImageNet-LT和iNaturalist 2018三个数据集上的实验结果表明,所提出方法在性能上优于当前最先进的技术。