11日前

密度を考慮した距離に基づく内部妥当性指標

{Caiming Zhong, Lianyu Hu}
要約

クラスタリング解析において、クラスタリング結果の品質を評価することは極めて重要である。文献には多くのクラスタ妥当性指標(CVI)が提案されてきたが、非球状のデータセットに対してはそれらにいくつかの制約が存在する。その一因として、クラスタ間の分離度を測定する手法が、外れ値や近接クラスタの影響を十分に考慮していないことが挙げられる。本論文では、密度情報を組み込んだ新しいロバストな距離測度を提案し、この問題を解決する。さらに、この分離度測度に基づく内部妥当性指標を構築した。この指標は、球状および非球状のクラスタ構造の両方に対応可能である。実験結果から、提案する指標がいくつかの古典的CVIを上回る性能を発揮することが示された。MATLABコードおよび実験データは、https://github.com/hulianyu/CVDD にて公開されている。

密度を考慮した距離に基づく内部妥当性指標 | 最新論文 | HyperAI超神経