Clustering
Das Gruppieren verwandter Beispiele wird im Allgemeinen für unüberwachtes Lernen verwendet. Sobald alle Proben gruppiert wurden, können die Forscher jedem Cluster optional eine Bedeutung zuweisen.
Es gibt viele Clustering-Algorithmen. Beispielsweise gruppiert der K-Means-Algorithmus Stichproben basierend auf ihrer Nähe zum Schwerpunkt, wie in der folgenden Abbildung dargestellt:

Forscher können diese Cluster dann anzeigen und andere Vorgänge ausführen, z. B. Cluster 1 als „Zwergbäume“ und Cluster 2 als „Bäume in voller Größe“ kennzeichnen.