HyperAI

Hierarchisches Clustering

Hierarchisches Clustering ist eine Sammlung von Algorithmen, die verschachtelte Cluster bilden, indem sie diese kontinuierlich von unten nach oben zusammenführen oder von oben nach unten aufteilen. Diese hierarchische Klasse wird durch ein „Dendrogramm“ dargestellt und der Agglomerative Clustering-Algorithmus ist einer davon.

Beim hierarchischen Clustering wird versucht, Stichprobendaten auf verschiedenen „Ebenen“ aufzuteilen und diese Schicht für Schicht zu clustern. Im Clusterbaum befinden sich die ursprünglichen Datenpunkte verschiedener Kategorien am unteren Ende des Baums, und der Stammknoten eines Clusters ist die oberste Ebene des Baums.

Klassifizierung der hierarchischen Clusterbildung

Derzeit gibt es zwei Methoden zum Erstellen von Clusterbäumen: Bottom-Up-Zusammenführung und Top-Down-Aufteilung.

Der Zusammenführungsalgorithmus der hierarchischen Clusterbildung berechnet hauptsächlich die Ähnlichkeit zwischen zwei Arten von Datenpunkten, kombiniert die beiden ähnlichsten Datenpunkte unter allen Datenpunkten und iteriert wiederholt. Einfach ausgedrückt ermittelt der Algorithmus die Ähnlichkeit, indem er die Distanz zwischen Datenpunkten berechnet. Je geringer der Abstand, desto höher die Ähnlichkeit. Die beiden Datenpunkte oder Kategorien mit dem geringsten Abstand werden kombiniert, um einen Clusterbaum zu erstellen.