على تأثير معامل التجميع المتوسط على التنبؤ بالروابط القائمة على البنية في الرسوم البيانية الخالية من الميزات

تُعدّ مشكلة التنبؤ بالروابط من المشكلات الأساسية في نظرية الرسوم البيانية، ولها تطبيقات متنوعة تشمل أنظمة التوصية، وكشف المجتمعات، وتحديد الاتصالات الكاذبة. وعلى الرغم من أن الطرق القائمة على السمات تحقق دقة عالية، فإن اعتمادها على خصائص العقد يحد من تطبيقاتها في الرسوم البيانية الخالية من السمات. أما في هذه الحالة، فيتم عادةً استخدام الطرق القائمة على البنية، مثل الطرق القائمة على الجيران المشتركين والطرق المعتمدة على الدرجة. لكن فعالية هذه الطرق تعتمد على كثافة الرسم البياني، حيث تُظهر الطرق القائمة على الجيران المشتركين أداءً جيدًا في الرسوم الكثيفة، بينما تكون الطرق المعتمدة على الدرجة أكثر ملاءمة للرسوم النادرة أو الشبيهة بالأشجار. ومع ذلك، يفتقر الأدب العلمي إلى معيار واضح لتمييز الرسوم الكثيفة عن الرسوم النادرة. تُقدّم هذه الورقة معامل التجميع المتوسط كمعيار لتقييم كثافة الرسم البياني، وذلك لمساعدة اختيار خوارزميات التنبؤ بالروابط. وللتغلب على ندرة المجموعات البيانات المستخدمة في التحليل التجريبي، نقترح طريقة جديدة لتصنيع الرسوم البيانية تعتمد على نموذج باراباسي-ألبرت، والتي تسمح بتغير مُتحكم به في كثافة الرسم البياني مع الحفاظ على التنوع البنائي. ومن خلال تجارب شاملة على مجموعات بيانات مُصطنعة وواقعية، نُحدد حدًا تجريبيًا لمعامل التجميع المتوسط، مما يُسهّل اختيار تقنيات التنبؤ بالروابط الفعّالة.