
초록
거리 기반 이상 탐지 방법의 점수는 해석하기 어렵기 때문에, 추가적인 맥락 없이 정상 데이터 포인트와 이상치 데이터 포인트 사이의 임계값을 결정하는 것이 어렵다. 본 연구에서는 거리 기반 이상점 점수를 해석 가능하고 확률적인 추정치로 변환하는 일반적인 방법을 제시한다. 이 변환은 순위 불변성(Ranking-stable)을 유지하면서 정상 데이터 포인트와 이상치 데이터 포인트 간의 대비를 강화한다. 데이터 포인트 간의 거리 관계를 파악하는 것은 데이터 내 근접 이웃 관계를 식별하는 데 필수적이지만, 대부분의 계산된 거리는 일반적으로 버려진다. 우리는 다른 데이터 포인트까지의 거리 정보를 활용하여 거리의 확률 분포를 모델링하고, 이를 바탕으로 거리 기반 이상점 점수를 이상치 확률로 변환할 수 있음을 보여준다. 실험 결과, 이 확률적 변환은 다양한 표형(tabular) 및 이미지 기준 데이터셋에서 이상 탐지 성능에 영향을 주지 않으면서도 정상 샘플과 이상 샘플 간의 대비를 높인 해석 가능한 이상점 점수를 제공함을 확인하였다. 본 연구는 다양한 거리 기반 이상 탐지 방법에 일반화 가능하며, 기존에 계산된 거리 정보를 활용하므로 추가적인 계산 부담 없이 효율적으로 적용할 수 있다.