
要約
多くのクラスタリング手法は、クラスタが任意の形状をしている場合、密度が異なる場合、あるいはデータクラスが不均衡で互いに近接している場合に、2次元空間であっても失敗する。このような課題に対応するため、本研究では新たなクラスタリング手法「DenMune」を提案する。この手法は、サイズKの相互最近傍(mutual nearest neighborhoods)を用いて密度の高い領域を同定するものであり、ユーザーが指定するパラメータはKのみであり、相互最近傍の一貫性原則(mutual nearest neighbor consistency principle)に従う。本アルゴリズムはKの広範な値に対して安定した性能を発揮する。さらに、クラスタリングプロセス中にノイズを自動的に検出し除去するとともに、目的のクラスタを正確に検出可能である。複数の低次元および高次元データセットにおいて、既存の最先端クラスタリング手法と比較して、本手法は高い堅牢性を示す。