2ヶ月前
オンラインクラスタリングのための双対対照学習
Li, Yunfan ; Yang, Mouxing ; Peng, Dezhong ; Li, Taihao ; Huang, Jiantao ; Peng, Xi

要約
本論文では、インスタンスレベルとクラスターレベルで双対的なコントラスティブ学習(TCL)を実施することによりオンラインクラスタリングを行う方法を提案しています。具体的には、データが目標のクラスター数と同じ次元の特徴空間に射影された場合、その特徴行列の各行と各列はそれぞれインスタンス表現とクラスター表現に対応することがわかりました。この観察に基づき、与えられたデータセットに対して、提案するTCLはまずデータ拡張を通じて正例と負例のペアを構築します。その後、特徴行列の行空間と列空間において、正例を引き寄せつつ負例を離すことで、それぞれインスタンスレベルとクラスターレベルでのコントラスティブ学習が行われます。内在的な偽負例ペアの影響を軽減し、クラスター割り当てを修正するために、信頼度に基づく基準を使用して疑似ラベルを選択し、両方のレベルでのコントラスティブ学習を強化します。その結果、クラスタリング性能がさらに向上します。双対的なコントラスティブ学習という優れたアイデアだけでなく、TCLのもう一つの利点は各インスタンスに対して独立してクラスター割り当てを予測できるため、オンラインシナリオに容易に適合できることです。6つの広く使用されている画像およびテキストベンチマークにおける広範な実験により、TCLの有効性が示されています。コードはGitHub上で公開される予定です。