2ヶ月前
オラクルベースのスケーラブルなエラスティックネット部分空間クラスタリングの活性集合アルゴリズム
Chong You; Chun-Guang Li; Daniel P. Robinson; Rene Vidal

要約
最先端の部分空間クラスタリング手法は、各データ点を他のデータ点の線形結合として表現し、係数行列を $\ell_1$、$\ell_2$ または核ノルムで正則化することに基づいています。$\ell_1$ 正則化は広範な理論的な条件下で部分空間保存の親和性(すなわち、異なる部分空間からの点間に接続がないこと)を保証しますが、クラスタ間の接続性は確保されない場合があります。$\ell_2$ および核ノルム正則化は通常、接続性を改善しますが、部分空間保存の親和性は独立した部分空間に対してのみ得られます。混合 $\ell_1$、$\ell_2$ および核ノルム正則化は部分空間保存と接続性の特性のバランスを提供しますが、これには計算複雑度の増加が伴います。本論文では、弾性ネット正則化($\ell_1$ と $\ell_2$ ノルムの混合)の幾何学的構造を研究し、最適な係数を見つけるための証明可能かつスケーラブルなアクティブセット法を開発しています。我々の幾何学的分析はまた、弾性ネット部分空間クラスタリングにおける接続性($\ell_2$ 正則化による)と部分空間保存($\ell_1$ 正則化による)特性のバランスに対する理論的根拠と幾何学的解釈を提供しています。実験結果から、提案されたアクティブセット法は最先端のクラスタリング性能を達成するだけでなく、大規模データセットも効率的に処理できることが示されました。