التجميع الهرمي
التجميع الهرمي هو عبارة عن مجموعة من الخوارزميات التي تشكل مجموعات متداخلة عن طريق الدمج المستمر من الأسفل إلى الأعلى أو الانقسام المستمر من الأعلى إلى الأسفل. يتم تمثيل هذه الفئة الهرمية بواسطة "مخطط شجري"، وخوارزمية التجميع التراكمي هي واحدة منها.
تحاول التجميعات الهرمية تقسيم بيانات العينة على "مستويات" مختلفة وتجميعها طبقة تلو الأخرى. في شجرة التجميع، توجد نقاط البيانات الأصلية للفئات المختلفة في أسفل الشجرة، وتكون عقدة الجذر للمجموعة هي أعلى الشجرة.
تصنيف التجميع الهرمي
هناك حاليًا طريقتان لإنشاء أشجار التجميع: الدمج من الأسفل إلى الأعلى والتقسيم من الأعلى إلى الأسفل.
تحسب خوارزمية الدمج في التجميع الهرمي بشكل أساسي التشابه بين نوعين من نقاط البيانات، وتجمع بين نقطتي البيانات الأكثر تشابهًا بين جميع نقاط البيانات، وتتكرر بشكل متكرر. ببساطة، تحدد الخوارزمية التشابه عن طريق حساب المسافة بين نقاط البيانات. كلما كانت المسافة أصغر، كلما كان التشابه أكبر. يتم دمج نقطتي البيانات أو الفئتين ذات المسافة الأقرب لإنشاء شجرة مجموعة.