9 天前

长尾分类中的良好与不良动量因果效应保留与去除

Kaihua Tang, Jianqiang Huang, Hanwang Zhang
长尾分类中的良好与不良动量因果效应保留与去除
摘要

随着类别数量的增加,在多个类别间保持数据集的平衡变得极具挑战性,这是因为数据本身具有长尾分布的特性;当感兴趣样本在同一个可采集单元中相互共存时(例如,一张图像中包含多个视觉实例),这一问题甚至变得不可行。因此,长尾分类是实现大规模深度学习的关键。然而,现有的方法主要依赖于重加权或重采样的启发式策略,缺乏坚实的理论基础。本文提出了一种因果推断框架,不仅揭示了以往方法背后的原理,还推导出一种全新的、具有理论依据的解决方案。具体而言,我们的理论表明,随机梯度下降(SGD)中的动量本质上是长尾分类中的一个混杂因子。一方面,它具有有害的因果效应,会导致尾部类别的预测被误导而偏向头部类别;另一方面,其引发的中介效应也有助于表示学习以及头部类别的预测。我们的框架通过聚焦于输入样本所引起的直接因果效应,巧妙地解耦了动量带来的矛盾影响。特别地,在训练阶段采用因果干预,在推理阶段运用反事实推理,从而在消除“不良”影响的同时保留“有益”作用。该方法在三个典型的长尾视觉识别基准上取得了新的最先进性能:长尾CIFAR-10/-100、ImageNet-LT(图像分类)以及LVIS(实例分割)。