16日前
クラスタリングのための表現学習:コンセンサス構築による
Aniket Anand Deshmukh, Jayanth Reddy Regatti, Eren Manavoglu, Urun Dogan

要約
本稿では、画像のクラスタリングを目的とした教師なし表現学習に焦点を当てる。近年の深層クラスタリングおよび教師なし表現学習の進展は、入力画像に対してデータ拡張技術により生成された異なる視点(ビュー)が表現空間内で近接していること(例示的一貫性)、および類似した画像が類似したクラスタ割り当てを持つこと(集団的一貫性)を前提としている。本研究では、新たな一貫性の概念として「コンセンサス的一貫性」を定義する。この概念は、表現空間内の変化、異なるクラスタリングアルゴリズム、あるいは同一クラスタリングアルゴリズムの異なる初期化に対して、類似した分割結果が得られるように表現を学習することを保証するものである。表現空間における変化を実行することでクラスタリング損失を定義し、コンセンサス的一貫性、例示的一貫性、集団的一貫性の3つの一貫性をエンドツーエンド学習フレームワークにシームレスに統合する。提案手法である教師なし表現学習を用いたコンセンサスクラスタリング(ConCURL)は、5つの画像データセットのうち4つにおいて、最先端手法よりも優れたクラスタリング性能を達成した。さらに、実世界のクラスタリングタスクで遭遇する課題(例えば分布シフトが生じた場合の性能維持)を反映するため、クラスタリング評価プロトコルを拡張した。また、提案手法の理解を深めるため、詳細なアブレーションスタディを実施した。コードおよび学習済みモデルは、https://github.com/JayanthRR/ConCURL_NCE にて公開されている。