
摘要
社区检测是指发现具有相似属性或功能的顶点群体,以理解网络数据的任务。随着深度学习的最新发展,图表示学习技术也被应用于社区检测。然而,通过基于学习到的顶点嵌入应用聚类算法来推断社区时,这些通用的聚类算法(如K均值和高斯混合模型)无法输出大量重叠的社区,而研究表明在许多现实世界网络中重叠社区非常普遍。本文提出了一种新的社区检测框架——CommunityGAN,该框架联合解决了重叠社区检测和图表示学习问题。首先,与传统图表示学习算法中的向量条目值没有特定含义不同,CommunityGAN的嵌入表示了顶点对社区的隶属强度。其次,采用了专门设计的生成对抗网络(Generative Adversarial Net, GAN)来优化这种嵌入。通过在模体级别生成器和判别器之间的极小极大竞争,两者可以交替迭代地提升性能,并最终输出更好的社区结构。大量的合成数据实验和现实任务验证表明,CommunityGAN在社区检测性能上显著优于现有方法。