HyperAIHyperAI
il y a 11 jours

Un indice de validité interne fondé sur une distance impliquant la densité

{Caiming Zhong, Lianyu Hu}
Résumé

Il est essentiel d’évaluer la qualité des résultats de regroupement dans l’analyse de regroupement (clustering). Bien que de nombreux indices de validité de regroupement (CVIs) aient été proposés dans la littérature, ceux-ci présentent certaines limitations lorsqu’ils sont appliqués à des ensembles de données non sphériques. Une des raisons réside dans le fait que la mesure de séparation entre clusters ne tient pas compte de l’impact des valeurs aberrantes ni des clusters voisins. Dans cet article, une nouvelle mesure de distance robuste, intégrant la densité, est conçue afin de résoudre ce problème, et un nouvel indice de validité interne basé sur cette mesure de séparation est ensuite proposé. Cet indice est capable de traiter à la fois les structures sphériques et non sphériques des clusters. Les résultats expérimentaux montrent que l’indice proposé surpasse certains CVIs classiques. Le code MATLAB ainsi que les données expérimentales sont disponibles à l’adresse suivante : https://github.com/hulianyu/CVDD

Un indice de validité interne fondé sur une distance impliquant la densité | Articles de recherche récents | HyperAI