17일 전

거리 기반 이상치의 확률적 변환

David Muhr, Michael Affenzeller, Josef Küng
거리 기반 이상치의 확률적 변환
초록

거리 기반 이상 탐지 방법의 점수는 해석하기 어렵기 때문에, 추가적인 맥락 없이 정상 데이터 포인트와 이상치 데이터 포인트 사이의 임계값을 결정하는 것이 어렵다. 본 연구에서는 거리 기반 이상점 점수를 해석 가능하고 확률적인 추정치로 변환하는 일반적인 방법을 제시한다. 이 변환은 순위 불변성(Ranking-stable)을 유지하면서 정상 데이터 포인트와 이상치 데이터 포인트 간의 대비를 강화한다. 데이터 포인트 간의 거리 관계를 파악하는 것은 데이터 내 근접 이웃 관계를 식별하는 데 필수적이지만, 대부분의 계산된 거리는 일반적으로 버려진다. 우리는 다른 데이터 포인트까지의 거리 정보를 활용하여 거리의 확률 분포를 모델링하고, 이를 바탕으로 거리 기반 이상점 점수를 이상치 확률로 변환할 수 있음을 보여준다. 실험 결과, 이 확률적 변환은 다양한 표형(tabular) 및 이미지 기준 데이터셋에서 이상 탐지 성능에 영향을 주지 않으면서도 정상 샘플과 이상 샘플 간의 대비를 높인 해석 가능한 이상점 점수를 제공함을 확인하였다. 본 연구는 다양한 거리 기반 이상 탐지 방법에 일반화 가능하며, 기존에 계산된 거리 정보를 활용하므로 추가적인 계산 부담 없이 효율적으로 적용할 수 있다.

거리 기반 이상치의 확률적 변환 | 최신 연구 논문 | HyperAI초신경