深層クラスタリング:畳み込み自己符号化器の埋め込みと相対エントロピー最小化の合同使用

画像クラスタリングは、最も重要なコンピュータビジョンの応用の一つであり、多くの研究で広く検討されてきました。しかし、現在のクラスタリング手法は、大規模かつ高次元データを扱う際、効率性とスケーラビリティに欠けることが多くあります。本論文では、DEeP Embedded RegularIzed ClusTering(DEPICT)と呼ばれる新しいクラスタリングモデルを提案します。このモデルは、データを識別的な埋め込み部分空間に効率的にマッピングし、クラスタ割り当てを正確に予測します。DEPICTは一般的に、多層畳み込み自己符号化器(multi-layer convolutional autoencoder)の上に積み重ねられた多項ロジスティック回帰関数(multinomial logistic regression function)から構成されています。我々は相対エントロピー(KLダイバージェンス)最小化を使用してクラスタリング目的関数を定義し、クラスタ割り当ての頻度に対する事前分布により正則化しています。その後、パラメータの更新とクラスタ割り当ての推定によって目的関数を最適化するための交互戦略が導出されます。さらに、自己符号化器における再構成損失関数をデータ依存型正則化項として用いることで、深層埋め込み関数が過学習することを防ぎます。エンドツーエンドでの最適化の利点を得るとともに層ごとの事前学習の必要性を排除するために、統一されたクラスタリングと再構成損失関数を同時に最小化し、すべてのネットワーク層を同時に学習する共同学習フレームワークを導入しました。実験結果は、DEPICTが実世界のクラスタリングタスクにおいて優れた性能と高速な実行時間を示していることを示しており、ハイパーパラメータ調整のためにラベル付きデータが利用できない場合でも有効であることが確認されました。