HyperAIHyperAI
منذ 2 أشهر

مؤشر صلاحية التجميع الداخلي باستخدام مقياس فصل مستند إلى المسافة

Shuyue Guan; Murray Loew
مؤشر صلاحية التجميع الداخلي باستخدام مقياس فصل مستند إلى المسافة
الملخص

تقييم نتائج التجميع هو جزء مهم من تحليل التجميع. في التعلم غير المشرف عادةً، لا توجد ملصقات فئات حقيقية للتجميع. لذلك، تم إنشاء عدد من التقييمات الداخلية التي تستخدم الملصقات المتوقعة والبيانات. وتُعرف هذه أيضًا باسم مؤشرات صلاحية التجمع الداخلية (CVIs). بدون ملصقات حقيقية، تصميم مؤشر فعال لصلاحية التجمع ليس بالأمر السهل لأنه مشابه لتصميم طريقة للتجميع. ولذلك، فإن وجود المزيد من مؤشرات صلاحية التجمع أمر بالغ الأهمية لأنه لا يوجد مؤشر شامل يمكن استخدامه لقياس جميع المجموعات البيانات، وليس هناك طريقة محددة لاختيار مؤشر صلاحية مناسب للusters بدون ملصقات حقيقية. وبناءً على ذلك، فإن تطبيق المزيد من مؤشرات صلاحية التجمع لتقييم نتائج التجميع أمر ضروري. في هذا البحث، نقترح مؤشرًا جديدًا لصلاحية التجمع يُسمى "مؤشر الفصل القائم على المسافة" (DSI)، وهو يستند إلى قياس فصل البيانات. قدمنا DSI مع ثمانية مؤشرات داخلية أخرى لصلاحية التجمع تتراوح بين الدراسات الأولى لديون (1974) حتى أحدث الدراسات CVDD (2019) كمقارنة. استخدمنا مؤشرًا خارجيًا لصلاحية التجمع كحقيقة أساسية لتقييم نتائج خمسة خوارزميات تجميع على 12 مجموعة بيانات حقيقية و97 مجموعة بيانات اصطناعية. أظهرت النتائج أن DSI هو مؤشر فعال ومميز ومنافس للمؤشرات الأخرى المقارنة به. بالإضافة إلى ذلك، قمنا بتلخيص العملية العامة لتقييم مؤشرات صلاحية التجمع وإنشاء طريقة جديدة - الاختلاف الرتبة - للمقارنة بين نتائج مؤشرات صلاحية التجمع.请注意,上文中“usters”应为“usters”(clusters)的拼写错误,因此在翻译中进行了修正。此外,“rank difference”被翻译为“الاختلاف الرتبة”,这是根据上下文推测出的一个合理翻译。如果需要更具体的术语,请提供进一步指导。

مؤشر صلاحية التجميع الداخلي باستخدام مقياس فصل مستند إلى المسافة | أحدث الأوراق البحثية | HyperAI