9 天前

长尾分类中的特征生成

Rahul Vigneswaran, Marc T. Law, Vineeth N. Balasubramanian, Makarand Tapaswi
长尾分类中的特征生成
摘要

视觉世界中的物体或场景实例数量天然存在不平衡,呈现出一种长尾分布(long-tailed distribution)。这种分布对基于深度学习的分类模型构成了重大挑战。尽管通过过采样尾部类别(tail classes)的样本可缓解这一不平衡问题,但受限于视觉多样性不足,往往导致模型的表征能力下降。一种简单的应对策略是将表征网络与分类器网络解耦,并仅使用过采样来训练分类器部分。本文提出了一种新方向:不再重复采样同一图像(从而导致特征重复),而是通过估计尾部类别的分布,生成具有意义的新增特征。受近期少样本学习(few-shot learning)相关思想的启发,我们构建了校准后的类别分布,用于采样额外的特征,进而用于分类器的训练。在具有不同不平衡因子的CIFAR-100-LT(长尾)数据集以及mini-ImageNet-LT(长尾)数据集上的多项实验表明,所提方法具有显著有效性,并达到了新的最先进(state-of-the-art)性能。此外,我们通过t-SNE可视化对生成特征进行了定性分析,并深入研究了用于校准尾部类别分布的最近邻样本。本文代码已开源,地址为:https://github.com/rahulvigneswaran/TailCalibX。

长尾分类中的特征生成 | 最新论文 | HyperAI超神经