
クラスタリングは、事前に定義されたラベルを用いずに、類似したデータサンプルをクラスタにまとめるタスクである。この分野は機械学習の文献において広く研究されており、近年の深層学習の進展により、再び注目を集めている。対照的クラスタリング(Contrastive Clustering, CC)モデルは、深層クラスタリングの代表的な手法であり、データ拡張を用いて各データインスタンスのポジティブペアとネガティブペアを生成する。CCモデルは、インスタンスレベルおよびクラスタレベルの表現において、ポジティブペアのインスタンスが特徴空間内で近接するように学習することを目指す。しかし、これらの手法は、クラスタリング性能の向上に不可欠な情報を持つインスタンス間のクロスパターン(cross-instance patterns)を無視している。その結果、モデルの偽陰性ペア率が上昇し、真陽性ペア率が低下するという問題が生じる。本論文では、サンプル間の関係性を考慮することで、ポジティブペアの数を増加させ、偽陰性、ノイズ、異常サンプルの影響を軽減する新しい対照的クラスタリング手法、Cross-instance guided Contrastive Clustering(C3)を提案する。特に、インスタンスレベルの表現を用いて類似するインスタンスを識別し、それらが集約するよう促す新しい損失関数を定義した。さらに、より効率的なネガティブサンプル選択を可能にする新たな重み付け手法を提案している。広範な実験評価の結果、本手法は代表的なコンピュータビジョンデータセットにおいて、最先端のアルゴリズムを上回ることを示した。CIFAR-10、CIFAR-100、ImageNet-10、ImageNet-Dogs、Tiny-ImageNetにおいて、それぞれ6.6%、3.3%、5.0%、1.3%、0.3%のクラスタリング精度向上を達成した。