HyperAI초신경

비미터법적 거리

비미터 거리직접성을 만족하지 않는 매개변수 간의 거리를 말합니다.

직접성은 세 객체 a, b, c에 대해 a에서 c까지의 거리와 c에서 b까지의 거리를 합한 값이 a에서 b까지의 거리보다 크거나 같다는 것을 의미합니다.

일반적으로 우리는 어떤 형태의 거리를 기준으로 유사성 측정을 정의합니다. 거리가 멀수록 유사성은 작아집니다.

비계량적 거리 및 거리 계산

거리 함수의 경우, 그것이 "거리 측정 기준"이라면, 다음의 기본 속성을 만족해야 합니다.

  • 비음수성: 두 지점 사이의 거리는 음수가 아닙니다.
  • 항등성: 두 점은 표본 공간에서 일치하는 경우에만 거리가 0이 될 수 있습니다.
  • 대칭: a에서 b까지의 거리는 b에서 a까지의 거리와 같습니다.
  • 직접성: a에서 c까지의 거리와 c에서 b까지의 거리를 합한 값이 a에서 b까지의 거리보다 크거나 같음.

연속적인 속성의 경우, 속성 간의 거리는 일반적으로 "민코프스키 거리"로 계산됩니다.

이산적인 속성의 경우, 민코프스키 거리를 사용하여 순서가 있는 값을 계산할 수도 있지만, {사과, 바나나, 복숭아}와 같이 값에 순서가 없는 경우에는 VDM(Value Difference Metric)을 사용하여 계산합니다.

VDMp(a, b)는 속성 u에 대한 서로 다른 클러스터에서 값 a와 b를 갖는 샘플의 분포 비율 차이의 p승을 나타냅니다. 이는 서로 다른 분포 비율을 통해 속성의 유사성을 근사화합니다.

비미터법적 거리의 거리 계산은 데이터 샘플을 기반으로 적절한 거리 계산 공식을 결정해야 합니다.