
要約
スペクトラルクラスタリングは最も人気のあるクラスタリング手法の一つです。しかし、限られた計算リソースで大規模なスペクトラルクラスタリングの効率と効果をバランスよく実現する方法は、長年にわたり適切に解決されていませんでした。本論文では、効率と効果のバランスを取るための分割統治法に基づく大規模スペクトラルクラスタリング手法を提案します。提案手法では、分割統治法に基づくランドマーク選択アルゴリズムと新しい近似類似度行列アプローチが設計され、低計算複雑度で疎な類似度行列を構築します。その後、二部グラフ分割プロセスを通じてクラスタリング結果を迅速に計算することができます。提案手法は、既存の大規模スペクトラルクラスタリング手法の大部分よりも低い計算複雑度を達成しています。10つの大規模データセットを用いた実験結果により、提案手法の効率性と効果性が示されています。提案手法のMATLABコードおよび実験データセットは、以下のURLから入手可能です: https://github.com/Li-Hongmin/MyPaperWithCode。注:「ランドマーク選択アルゴリズム」(landmark selection algorithm)、「近似類似度行列アプローチ」(approximate similarity matrix approach)、「二部グラフ分割プロセス」(bipartite graph partition process)などの専門用語については一般的な日本語訳を使用しました。これらの用語が特定の文脈で異なる訳し方がある場合は、その文脈に合わせて適宜調整してください。