
要約
本論文では、深層表現と画像クラスタの合同非監督学習(Joint Unsupervised LEarning: JULE)のための再帰的なフレームワークを提案します。当該フレームワークにおいては、クラスタリングアルゴリズムの連続する操作が、畳み込みニューラルネットワーク(Convolutional Neural Network: CNN)によって出力された表現の上に積み重ねられた再帰プロセスのステップとして表現されます。訓練中には、画像クラスタと表現が合同で更新されます:順方向パスでは画像クラスタリングが行われ、逆方向パスでは表現学習が行われます。このフレームワークの中心的な考え方は、良い表現が画像クラスタリングに有利であり、クラスタリング結果が表現学習に対する教師信号を提供することです。2つのプロセスを統一された重み付きトリプレット損失を持つ単一モデルに統合し、エンドツーエンドで最適化することで、より強力な表現だけでなく、より正確な画像クラスタも得ることができます。広範な実験により、当方法がさまざまな画像データセットにおける最新手法を上回ることが示されています。さらに、学習された表現は他のタスクへの転移時に良好な汎化性能を示すことが確認されています。