要約
アンサンブルクラスタリングは、クラスタリングタスクにおける高い性能から、機械学習およびデータマイニング分野で注目を集めている。スペクトルクラスタリングは、従来のクラスタリング手法と比較して優れた性能を発揮する最も代表的なクラスタリング手法の一つである。既存のアンサンブルクラスタリング手法は、通常、ベースとなるクラスタリングアルゴリズムのクラスタリング結果をそのままアンサンブル学習に利用するが、これではスペクトルクラスタリングにおいてグラフラプラシアンが探査するデータの内在構造を十分に活用できず、望ましいクラスタリング結果を得ることができない。本稿では、スペクトルクラスタリングに基づくクラスタリングアルゴリズムに対する新たなアンサンブル学習手法を提案する。本手法は、各ベーススペクトルクラスタリングアルゴリズムから得られるスペクトル埋め込みから、アンサンブル学習によりロバストなグラフラプラシアン表現を学習する点に特徴がある。その後、学習されたグラフラプラシアンから得られるスペクトル埋め込みに対してk-meansを適用し、最終的なクラスタを生成する。合成データおよび実世界データを用いた実験結果から、本手法が他の既存のアンサンブルクラスタリング手法を上回ることを示した。