
要約
機械学習のクラスタリングと深層モデルを組み合わせることで、深層クラスタリングにおいて著しい優位性が示されています。この手法はデータ処理パイプラインを特徴量クラスタリングとモデル訓練の2つの交互に実行されるフェーズに変更します。しかし、このような交互スケジュールは不安定性や計算負荷の問題を引き起こす可能性があります。本研究では、深層学習技術を積極的に適応させ、オンライン深層クラスタリングでの容易な導入を可能にする中心点を持たないクラスタリングアルゴリズムである確率集約クラスタリング(Probability Aggregation Clustering: PAC)を提案します。PACはクラスタ中心点を回避し、新しい目的関数を用いてクラスタリングを最適化問題として定式化することで、確率空間と分布空間を整合させます。PACの計算メカニズムに基づき、ミニバッチデータ上で安定かつ柔軟な特徴量クラスタリングを行うための一般的なオンライン確率集約モジュールを提案し、さらに深層視覚クラスタリングフレームワークである深層PAC(Deep PAC: DPAC)を構築しました。広範な実験結果から、PACは優れたクラスタリングの堅牢性と性能を持つことが示され、DPACは最先端の深層クラスタリング手法に対して顕著に優れていることが確認されました。