Ein internes Gültigkeitsmaß basierend auf abstandsbasierter Dichte
Es ist entscheidend, die Qualität der Clustering-Ergebnisse in der Clusteranalyse zu bewerten. Obwohl in der Literatur zahlreiche Güteindizes für Cluster (Cluster Validity Indices, CVIs) vorgeschlagen wurden, weisen diese bei der Behandlung nicht-sphärischer Datensätze gewisse Einschränkungen auf. Ein Grund hierfür ist, dass die Messung der Cluster-Trennschärfe die Auswirkungen von Ausreißern und benachbarten Clustern nicht berücksichtigt. In diesem Beitrag wird ein neuer robuster Abstandsmesswert vorgestellt, der Dichte berücksichtigt, um dieses Problem zu lösen. Darauf aufbauend wird ein interner Güteindex vorgeschlagen, der auf dieser Trennmaßnahme basiert. Dieser Index ist in der Lage, sowohl sphärische als auch nicht-sphärische Clusterstrukturen zu bewältigen. Die experimentellen Ergebnisse zeigen, dass der vorgeschlagene Index einige klassische CVIs übertrifft. Der MATLAB-Code und die experimentellen Daten sind unter https://github.com/hulianyu/CVDD verfügbar.