
要約
画像クラスタリングは機械学習およびコンピュータビジョン分野において重要な課題であるが、同時に非常に困難なタスクでもある。従来の手法は、特徴学習とクラスタリングの間の連携を無視しがちである。この問題に対処するために、本研究では深層適応クラスタリング(Deep Adaptive Clustering; DAC)を提案する。DACはクラスタリング問題を、画像ペアが同一クラスタに属するかどうかを二値のペア分類で判断する枠組みに再定式化する。DACでは、深層畳み込みネットワーク(ConvNet)によって生成された画像のラベル特徴間のコサイン距離をもって類似度を計算する。さらに、DACに制約を導入することで、学習されたラベル特徴がワンホットベクトルに近づくようになり、画像のクラスタリングに利用可能となる。主な課題は、画像クラスタリングにおいて真の類似度が未知である点である。この問題に対処するため、ラベル付きサンプルの選択とConvNetの訓練を交互に繰り返す「交替的反復適応学習アルゴリズム」を提案する。最終的に、学習されたラベル特徴に基づいて画像が自動的にクラスタリングされる。実験結果から、DACは5つの代表的なデータセットにおいて最先端の性能を達成しており、特にMNISTでは97.75%、CIFAR-10では52.18%、STL-10では46.99%のクラスタリング精度を実現した。