초록
군집 분석에서 군집 결과의 품질을 평가하는 것은 매우 중요하다. 문헌에서 많은 군집 타당성 지표(Cluster Validity Indices, CVIs)가 제안되었지만, 비구형 데이터셋을 다룰 때 일부 한계를 가지고 있다. 그 이유 중 하나는 군집 간 분리도 측정이 이상치(outliers)와 근접 군집의 영향을 고려하지 않는다는 점이다. 본 논문에서는 밀도를 통합한 새로운 로버스트 거리 측정법을 설계하여 이 문제를 해결하고, 이러한 분리도 측정 기반의 내부 타당성 지표를 제안한다. 제안된 지표는 구형과 비구형 구조를 가진 군집 모두에 대응할 수 있다. 실험 결과는 제안된 지표가 일부 전통적인 CVIs보다 우수함을 보여준다. MATLAB 코드 및 실험 데이터는 https://github.com/hulianyu/CVDD 에서 제공된다.