
초록
분포 외(Distribution-out, OOD) 탐지는 머신러닝 모델을 오픈 월드 환경에 적용하는 데 있어 핵심적인 과제이다. 거리 기반 방법들은 테스트 샘플이 분포 내(ID) 데이터로부터 상대적으로 멀리 떨어져 있을 경우 이를 OOD로 탐지한다는 점에서 유망성을 보여왔다. 그러나 기존 방법들은 잠재적인 특징 공간에 대해 강한 분포 가정을 수반하는데, 이러한 가정이 항상 성립하는 것은 아니다. 본 논문에서는 기존 연구에서 거의 간과되었던 비모수적 근접 이웃 거리(nearest-neighbor distance)의 효과성을 탐구한다. 기존 연구들과 달리, 본 연구 방법은 어떠한 분포 가정도 도입하지 않아 더 높은 유연성과 일반화 능력을 제공한다. 다양한 벤치마크에서 근접 이웃 기반 OOD 탐지의 효과성을 입증하고, 우수한 성능을 확보하였다. ImageNet-1k에서 학습된 동일한 모델 기준으로, 본 방법은 파라미터 기반의 마할라노비스 거리(Mahalanobis distance)를 사용하는 강력한 베이스라인 SSD+ 대비 FPR@TPR95(정확도 95%일 때의 오류 긍정률)를 24.77%나 감소시켰다. 코드는 다음 링크에서 제공된다: https://github.com/deeplearning-wisc/knn-ood.