HyperAI超神経

非メートル法距離非メートル法距離

非計量距離直接性を満たさないパラメータ間の距離を指します。

直接性とは、3 つのオブジェクト a、b、c について、a から c までの距離に c から b までの距離を加えたものが、a から b までの直接の距離以上であることを意味します。

通常、何らかの形式の距離に基づいて類似性の尺度を定義します。距離が大きいほど、類似性は小さくなります。

非計量距離と距離の計算

距離関数の場合、それが「距離メトリック」の場合、次の基本プロパティを満たす必要があります。

  • 非負性: 2 点間の距離は負ではありません。
  • 恒等性: 2 点間の距離がゼロになるのは、それらがサンプル空間内で一致する場合のみです。
  • 対称性: a から b までの距離は、b から a までの距離と等しい。
  • 直接性: a から c までの距離に c から b までの距離を加えたものが、a から b までの直接の距離以上である。

連続属性では、それらの間の距離は通常「ミンコフスキー距離」によって計算されます。

離散的な属性の場合、「ミンコフスキー距離」を使用して順序付きの値を計算することもできますが、{リンゴ、バナナ、桃}のように値が順序付けされていない場合は、VDM (Value Difference Metric) を使用して計算します。

VDMp (a, b) は、属性 u の異なるクラスター上の値 a と b を持つサンプルの分布割合の差の p 乗を表します。分布比率の違いを通じて属性の類似性を近似します。

非メートル法距離の距離計算では、データ サンプルに基づいて適切な距離計算式を決定する必要があります。