11日前

生成的対抗的クラスタリングネットワークにおけるバランスの取れた自己ペース学習

{ Heng Huang, Cheng Deng, Xiaoqian Wang, Kamran Ghasedi}
生成的対抗的クラスタリングネットワークにおけるバランスの取れた自己ペース学習
要約

クラスタリングは、さまざまな機械学習応用において重要な問題であるが、複雑な実データを扱う際には依然として挑戦的な課題である。既存のクラスタリング手法は、データの非線形性を十分に捉えられない浅層モデルを用いるもの、あるいはパラメータ数が多く過学習を引き起こしやすい深層モデルを用いるものである。本論文では、教師なしのアプローチで深層クラスタリングモデルの学習を効果的に実現するため、深層生成対抗クラスタリングネットワーク(ClusterGAN)を提案する。ClusterGANは、識別器(discriminator)、生成器(generator)、およびクラスタラー(clustering network、以下クラスタリングネットワーク)の3つのネットワークから構成される。これらの3つのネットワーク間で対抗的ゲームを構築し、生成器により識別的な潜在変数から現実的なサンプルを合成するとともに、クラスタラーにより実データの逆写像を識別的埋め込み空間に学習する。さらに、クラスタ内サンプル間の類似性を高め、クラスタ間の類似性を低減するため、条件付きエントロピー最小化損失を導入する。クラスタリングタスクでは真の類似性が未知であるため、本研究では、容易なサンプルから困難なサンプルへと段階的に訓練データを追加しつつ、すべてのクラスタから選択されたサンプルの多様性を考慮する新しいバランス型自己-paced学習アルゴリズムを提案する。このアプローチにより、提示された対抗的ゲームとバランス型自己-paced学習アルゴリズムを活用して、深さの大きいクラスタラーを効率的に訓練することが可能となる。実験の結果、複数のデータセットにおいて、従来の最先端のクラスタリングおよびハッシングモデルと比較して、ClusterGANは競争力のある性能を達成した。

生成的対抗的クラスタリングネットワークにおけるバランスの取れた自己ペース学習 | 最新論文 | HyperAI超神経