
要約
教師なし画像分類は、コンピュータビジョンにおける挑戦的な課題である。深層学習に基づくアルゴリズムは優れた成果を達成しており、最新の手法では埋め込み(embedding)プロセスとクラス割り当てプロセスから得られる統一損失関数を採用している。しかしながら、これらのプロセスは本質的に異なる目的を持つため、同時に最適化しようとすると、最適解に到達しにくいという課題がある。この問題を解決するために、我々は新たな二段階アルゴリズムを提案する。本手法では、事前学習用の埋め込みモジュールの後に、埋め込みとクラス割り当てを同時に実行する精緻化モジュールを配置する。複数のデータセットを用いた実験において、本モデルは最先端(SOTA)を上回る性能を示し、教師なしタスクにおいてCIFAR-10で81.0%(前回比9.3ポイント向上)、CIFAR-100-20で35.3%(9.6ポイント向上)、STL-10で66.5%(6.9ポイント向上)の高い精度を達成した。