CommunityGAN: اكتشاف المجتمعات باستخدام الشبكات المولدة المتنافسة

اكتشاف المجتمعات يشير إلى مهمة اكتشاف مجموعات من الرؤوس التي تشترك في خصائص أو وظائف مماثلة لفهم بيانات الشبكة. مع التطور الحديث في التعلم العميق، تم استخدام تقنيات تعلم تمثيل الرسم البياني أيضًا لاكتشاف المجتمعات. ومع ذلك، يمكن استنتاج المجتمعات فقط من خلال تطبيق خوارزميات التجميع على أساس التضمينات المُتعلَّمة للرؤوس. هذه الخوارزميات العامة للتجميع مثل K-means ونموذج الخليط الغاوسية (Gaussian Mixture Model) لا تستطيع إخراج مجتمعات متداخلة بشكل كبير، والتي أثبتت أنها شائعة جدًا في العديد من شبكات العالم الحقيقي. في هذا البحث، نقترح CommunityGAN، إطار جديد لاكتشاف المجتمعات يقوم بحل مشكلتي اكتشاف المجتمعات المتداخلة وتعلم تمثيل الرسم البياني بشكل مشترك. أولاً، على عكس تضمين الخوارزميات التقليدية لتعلم تمثيل الرسم البياني حيث قيم العناصر المتجهية ليس لها معنى محدد، فإن تضمين CommunityGAN يشير إلى قوة انتماء الرؤوس للمجتمعات. ثانياً، يتم استخدام شبكة مولدة متنافسة (Generative Adversarial Net - GAN) مصممة خصيصًا لتحسين هذا التضمين. من خلال المنافسة المينيماكسية بين المولد والمناهض على مستوى النماذج الفرعية (motif-level)، يمكن لكل منهما تعزيز أدائه بديلاً وتكرارياً وأخيراً إخراج بنية مجتمع أفضل. تجارب واسعة النطاق على البيانات الاصطناعية ومهمات العالم الحقيقي تظهر أن CommunityGAN يحقق مكاسب كبيرة في أداء اكتشاف المجتمعات بالمقارنة مع أفضل الأساليب الحالية.