Distance Non Métrique
Distance non métriqueIl s'agit de la distance entre les paramètres qui ne satisfont pas à la franchise.
La directivité signifie que pour trois objets a, b, c, la distance de a à c plus la distance de c à b est supérieure ou égale à la distance de a directement à b ;
Habituellement, nous définissons les mesures de similarité en fonction d'une certaine forme de distance : plus la distance est grande, plus la similarité est faible.
Distance non métrique et calcul de distance
Pour une fonction de distance, s'il s'agit d'une « métrique de distance », elle doit satisfaire les propriétés de base suivantes :
- Non-négativité : La distance entre deux points n’est pas négative ;
- Identité : Deux points ne peuvent avoir une distance nulle que s’ils coïncident dans l’espace échantillon ;
- Symétrie : la distance de a à b est égale à la distance de b à a ;
- Directivité : la distance de a à c plus la distance de c à b est supérieure ou égale à la distance de a directement à b ;
Pour les attributs continus, la distance entre eux est généralement calculée par la « distance de Minkowski ».
Pour les attributs discrets, la distance de Minkowski peut également être utilisée pour calculer les valeurs ordonnées, mais lorsque les valeurs ne sont pas ordonnées, telles que {pomme, banane, pêche}, VDM (Value Difference Metric) est utilisé pour le calcul.
VDMp (a, b) représente la puissance p de la différence dans le rapport de distribution des échantillons avec les valeurs a et b dans différents clusters sur l'attribut u. Il évalue la similarité des attributs par différents ratios de distribution.
Le calcul de la distance non métrique doit déterminer la formule de calcul de distance appropriée en fonction des échantillons de données.