
摘要
现有的大多数分布外(Out-of-Distribution, OOD)检测算法依赖于单一输入源:特征表示、logit值或softmax概率。然而,OOD样本具有极大的多样性,使得此类方法变得脆弱。某些OOD样本在特征空间中易于识别,但在logit空间中却难以区分,反之亦然。基于这一观察,我们提出了一种新型的OOD评分方法——虚拟logit匹配(Virtual-logit Matching, ViM),该方法结合了特征空间中的类别无关得分与分布内(In-Distribution, ID)类别相关的logit信息。具体而言,通过特征与主成分空间残差生成一个代表虚拟OOD类别的附加logit,并通过固定缩放因子将其与原始logit进行匹配。对这一虚拟logit进行softmax变换后得到的概率值,即作为OOD程度的度量指标。为促进学术界在大规模OOD检测任务上的评估,我们构建了一个新的ImageNet-1K规模的OOD数据集,该数据集由人工标注,其规模为现有数据集的8.8倍。我们开展了大量实验,涵盖CNN与视觉Transformer等多种模型架构,充分验证了所提出的ViM评分方法的有效性。特别是在使用BiT-S模型时,我们的方法在四个具有挑战性的OOD基准测试上取得了平均AUROC 90.91%的性能,较最佳基线高出4个百分点。相关代码与数据集已开源,地址为:https://github.com/haoqiwang/vim。