HyperAI

التجميع الهرمي

التجميع الهرمي هو عبارة عن مجموعة من الخوارزميات التي تشكل مجموعات متداخلة عن طريق الدمج المستمر من الأسفل إلى الأعلى أو الانقسام المستمر من الأعلى إلى الأسفل. يتم تمثيل هذه الفئة الهرمية بواسطة "مخطط شجري"، وخوارزمية التجميع التراكمي هي واحدة منها.

تحاول التجميعات الهرمية تقسيم بيانات العينة على "مستويات" مختلفة وتجميعها طبقة تلو الأخرى. في شجرة التجميع، توجد نقاط البيانات الأصلية للفئات المختلفة في أسفل الشجرة، وتكون عقدة الجذر للمجموعة هي أعلى الشجرة.

تصنيف التجميع الهرمي

هناك حاليًا طريقتان لإنشاء أشجار التجميع: الدمج من الأسفل إلى الأعلى والتقسيم من الأعلى إلى الأسفل.

تحسب خوارزمية الدمج في التجميع الهرمي بشكل أساسي التشابه بين نوعين من نقاط البيانات، وتجمع بين نقطتي البيانات الأكثر تشابهًا بين جميع نقاط البيانات، وتتكرر بشكل متكرر. ببساطة، تحدد الخوارزمية التشابه عن طريق حساب المسافة بين نقاط البيانات. كلما كانت المسافة أصغر، كلما كان التشابه أكبر. يتم دمج نقطتي البيانات أو الفئتين ذات المسافة الأقرب لإنشاء شجرة مجموعة.