
要約
従来の画像クラスタリング手法は、特徴学習とクラスタリングを順次的に行う二段階アプローチを採用しています。しかし、最近の研究結果では、これらの分離されたフェーズを統一的なフレームワークに組み込み、共同で訓練することで、より優れた性能が得られることを示しています。本論文では、まず画像特徴学習のために完全畳み込み自己符号化器(fully convolutional auto-encoders)を導入し、その後、完全畳み込み自己符号化器とソフト $k$-平均スコア(soft $k$-means scores)に基づいて、画像表現とクラスタ中心を共同で学習する統一的なクラスタリングフレームワークを提案します。学習手続きの初期段階では、自己符号化器から抽出された表現が後続のクラスタリングに対して十分に識別力を持つとは限りません。この問題に対処するために、高スコア割り当てが強調され、低スコア割り当てが軽視されるようにブーステッド識別分布(boosted discriminative distribution)を採用します。徐々に強化される識別力により、クラスタリング割り当てスコアが識別され、クラスタ純度が向上します。いくつかのビジョンベンチマークデータセットでの実験結果は、我々の手法が最先端の性能を達成できることを示しています。