2ヶ月前

N2D: (Not Too) Deep Clustering via Clustering the Local Manifold of an Autoencoded Embedding N2D: (それほど) 深層クラスタリングによる自己符号化埋め込みの局所多様体のクラスタリング

Ryan McConville; Raul Santos-Rodriguez; Robert J Piechocki; Ian Craddock
N2D: (Not Too) Deep Clustering via Clustering the Local Manifold of an Autoencoded Embedding
N2D: (それほど) 深層クラスタリングによる自己符号化埋め込みの局所多様体のクラスタリング
要約

深層クラスタリングは、従来の浅いクラスタリングアルゴリズムに対して優位性を示すことがますます増えています。深層クラスタリングアルゴリズムは通常、表現学習と深層ニューラルネットワークを組み合わせてこの性能を達成し、クラスタリング損失と非クラスタリング損失の最適化を行います。このような場合、オートエンコーダーがクラスタリングネットワークと接続され、最終的なクラスタリングはオートエンコーダーとクラスタリングネットワークの両方によって共同で学習されます。一方で、我々はオートエンコードされた埋め込みを学習し、その後その埋め込みに含まれる潜在的な多様体(manifold)を探ることを提案します。単純さの観点から、深いネットワークではなく浅いクラスタリングアルゴリズムを使用してこの埋め込みをクラスタリングします。我々は、生データとオートエンコードされた埋め込みの両方に対して複数の局所的および全局所的な多様体学習手法を研究しました。その結果、UMAPが我々のフレームワークにおいて最もクラスター化可能な多様体を見つける能力が高いことがわかりました。これは、オートエンコードされた埋め込み上の局所的多様体学習がより高品質なクラスター発見に効果的であることを示唆しています。我々は一連の画像データセットと時系列データセットに対して定量的に評価を行い、提案手法が最新の深層クラスタリングアルゴリズムに対して競争力のある性能を持つことを確認しました。特にいくつかのデータセットでは現行の最先端技術を上回っています。これらの結果は、深層クラスタリングにおける有望な研究方向性を示していると考えられます。本研究で使用したコードは https://github.com/rymc/n2d で公開されています。

N2D: (Not Too) Deep Clustering via Clustering the Local Manifold of an Autoencoded Embedding N2D: (それほど) 深層クラスタリングによる自己符号化埋め込みの局所多様体のクラスタリング | 最新論文 | HyperAI超神経