HyperAI

تجميع K-means

التجميع باستخدام طريقة k-meansإنها طريقة كمية المتجهات التي كانت تستخدم في معالجة الإشارات في الأيام الأولى. يتم استخدامه حاليًا بشكل أساسي كطريقة لتحليل التجميع في مجال استخراج البيانات.

الغرض من التجميع باستخدام متوسط k هو تقسيم n نقطة إلى مجموعات k بحيث تنتمي كل نقطة إلى المجموعة المقابلة لأقرب متوسط، واستخدام هذا كمعيار للتجميع. يمكن فهم هذا النوع من المشكلات على أنه مشكلة تقسيم مساحة البيانات إلى خلايا فورونوي، والتي تستخدم بشكل أساسي لتجميع نقاط البيانات ثنائية الأبعاد.

الخطوات الرئيسية

1. حدد نقاط k كنقط كتلة أولية؛

2. كرر الخطوات:

  • قم بتعيين كل نقطة إلى أقرب مركز لتكوين k مجموعة؛
  • إعادة حساب مركز كل مجموعة؛

3. حتى لا يتغير التجمع أو يتم الوصول إلى الحد الأقصى لعدد التكرارات.

مقاييس المسافة والوظائف الموضوعية

خذ في الاعتبار دالة المسافة الإقليدية واستخدم مجموع الأخطاء التربيعية كدالة هدف للتجميع.

الإيجابيات والسلبيات

المزايا: خوارزمية k-means هي خوارزمية كلاسيكية لمشاكل التجميع. تعتبر الخوارزمية بسيطة وسريعة، وتتمتع بكفاءة خوارزمية عالية نسبيًا لكميات كبيرة من البيانات. تُستخدم قابلية التوسع العالية عادةً كخوارزمية إنهاء مثالية محلية. يكون تأثير التجميع أفضل عندما تكون المجموعات كثيفة، ومستديرة، ومتكتلة، وتكون الاختلافات بين المجموعات واضحة.

العيوب: يجب على المستخدم تحديد عدد المجموعات التي سيتم إنشاؤها مسبقًا؛ الخوارزمية حساسة للقيمة الأولية، والقيم الأولية المختلفة ستؤدي إلى نتائج تجميع مختلفة؛ فهو حساس لبيانات الضوضاء وبيانات النقاط المعزولة، وكمية صغيرة من البيانات سيكون لها تأثير كبير على القيمة المتوسطة.

مراجع

【1】خوارزمية k-means - ويكيبيديا

【2】http://hometown.group/wp-content/uploads/2018/07/%E8%81%9A%E7%B1%BB.pdf