
要約
分布外(Out-of-distribution, OOD)検出は、機械学習モデルをオープンワールド環境に導入する上で重要な課題である。距離ベースの手法は有望な結果を示しており、テストサンプルが分布内(in-distribution, ID)データから相対的に遠い場合にOODと判定する。しかし、従来の手法は潜在的な特徴空間に対して強い分布仮定を課しているが、この仮定が常に成立するとは限らない。本論文では、これまでの研究でほとんど無視されてきた非パラメトリックな最近傍距離の有効性に着目する。従来の手法とは異なり、本手法はいかなる分布仮定も課さないため、より高い柔軟性と一般性を備えている。我々は、複数のベンチマーク上で最近傍に基づくOOD検出の有効性を実証し、優れた性能を達成した。ImageNet-1kで訓練された同一モデルを用いた比較において、パラメトリックなアプローチであるマハラノビス距離を用いる強力なベースラインSSD+と比較して、本手法はFPR@TPR95(TPR95における偽陽性率)を24.77%大幅に低減した。コードは以下のリンクから公開されている:https://github.com/deeplearning-wisc/knn-ood。