13 天前

基于最近邻的分布外检测

Jaewoo Park, Yoon Gyo Jung, Andrew Beng Jin Teoh
基于最近邻的分布外检测
摘要

在开放世界环境中部署的机器学习模型,检测分布外(Out-of-Distribution, OOD)样本至关重要。基于分类器的评分方法因其具备细粒度检测能力,已成为OOD检测的标准手段。然而,这类评分方法常存在过度自信问题,导致远离分布内(In-Distribution, ID)区域的OOD样本被错误分类。为应对这一挑战,本文提出一种名为最近邻引导(Nearest Neighbor Guidance, NNGuide)的方法,通过引导分类器评分尊重数据流形的边界几何结构,有效缓解OOD样本的过度自信问题,同时保持分类器评分原有的细粒度检测能力。我们在多种设置下,针对ImageNet OOD检测基准进行了大量实验,涵盖ID数据发生自然分布偏移的场景。实验结果表明,NNGuide显著提升了基础检测评分的性能,在AUROC、FPR95和AUPR三项指标上均达到当前最优水平。相关代码已公开,地址为:\url{https://github.com/roomo7time/nnguide}。