HyperAI超神経

階層的クラスタリング

階層的クラスタリングは、下から上への継続的なマージ、または上から下への分割によって入れ子のクラスターを形成するアルゴリズムの集合であり、この階層クラスは「樹状図」によって表現され、凝集クラスタリング アルゴリズムもその 1 つです。

階層的クラスタリングでは、サンプル データをさまざまな「レベル」で分割し、それらを層ごとにクラスタリングしようとします。クラスタリング ツリーでは、さまざまなカテゴリの元のデータ ポイントがツリーの最下位層となり、ノードが最上位になります。木のレベル。

階層的クラスタリングの分類

現在、クラスタリング ツリーを作成するには、ボトムアップの結合とトップダウンの分割の 2 つの方法があります。

階層的クラスタリングのマージ アルゴリズムは、主に 2 種類のデータ セットの点間の類似性を計算し、すべてのデータ ポイントのうち最も類似した 2 つのデータ ポイントを結合し、繰り返し反復します。簡単に言うと、このアルゴリズムはデータ ポイント間の距離を計算することで類似性を判断し、距離が小さいほど類似性が高くなります。2 つの最も近いデータ ポイントまたはカテゴリを組み合わせてクラスタリング ツリーを生成します。