非メートル法距離非メートル法距離
非計量距離直接性を満たさないパラメータ間の距離を指します。
直接性とは、3 つのオブジェクト a、b、c について、a から c までの距離に c から b までの距離を加えたものが、a から b までの直接の距離以上であることを意味します。
通常、何らかの形式の距離に基づいて類似性の尺度を定義します。距離が大きいほど、類似性は小さくなります。
非計量距離と距離の計算
距離関数の場合、それが「距離メトリック」の場合、次の基本プロパティを満たす必要があります。
- 非負性: 2 点間の距離は負ではありません。
- 恒等性: 2 点間の距離がゼロになるのは、それらがサンプル空間内で一致する場合のみです。
- 対称性: a から b までの距離は、b から a までの距離と等しい。
- 直接性: a から c までの距離に c から b までの距離を加えたものが、a から b までの直接の距離以上である。
連続属性では、それらの間の距離は通常「ミンコフスキー距離」によって計算されます。
離散的な属性の場合、「ミンコフスキー距離」を使用して順序付きの値を計算することもできますが、{リンゴ、バナナ、桃}のように値が順序付けされていない場合は、VDM (Value Difference Metric) を使用して計算します。
VDMp (a, b) は、属性 u の異なるクラスター上の値 a と b を持つサンプルの分布割合の差の p 乗を表します。分布比率の違いを通じて属性の類似性を近似します。
非メートル法距離の距離計算では、データ サンプルに基づいて適切な距離計算式を決定する必要があります。