
要約
最近の画像クラスタリングにおける進歩は、より良い深層表現を学習することに焦点を当てています。これに対して、我々は抽象的な特徴に依存せず、代わりに画像変換を予測し、直接画像空間でクラスタリングを行う正規直交アプローチを提案します。この学習過程は、K-meansやガウス混合モデルの勾配ベースの訓練に自然と適合し、追加の損失関数やハイパーパラメータを必要としません。これにより、プロトタイプと変換を共同で学習する2つの新しい深層変換不変クラスタリングフレームワークが導き出されます。具体的には、空間的、色的、形態学的な変換に対する不変性を解決できる深層学習モジュールを使用しています。我々のアプローチは概念的に単純であり、タスクに応じて望ましい不変性を容易に適応させることができたり、クラスタ中心とクラスタへの割り当ての解釈可能性が高いといった利点があります。標準的な画像クラスタリングベンチマークにおいて、我々の新しいアプローチが競争力がありかつ非常に有望な結果を示すことを実証しました。最後に、実際の写真コレクションでのクラスタリング結果の可視化を通じて、その堅牢性と改善された解釈可能性の利点を示しています。(注:「orthogonal approach」は「正規直交アプローチ」と訳しましたが、「対照的なアプローチ」や「独立したアプローチ」という訳も可能です。文脈によって最適な訳語を選択してください。)