11 天前

重新思考用于属性图聚类的图自编码器模型

Nairouz Mrabah, Mohamed Bouguessa, Mohamed Fawzi Touati, Riadh Ksantini
重新思考用于属性图聚类的图自编码器模型
摘要

近年来,大多数图聚类方法采用图自编码器(Graph Auto-Encoders, GAEs)实现聚类与嵌入学习的联合优化。然而,现有方法忽视了两个关键问题。其一,由于在存在噪声的聚类分配下进行学习,导致误差累积,从而降低了聚类模型的有效性与鲁棒性,这一问题被称为特征随机性(Feature Randomness)。其二,重构邻接矩阵的过程使模型学习到与聚类任务无关的相似性信息,这一问题被称为特征漂移(Feature Drift)。值得注意的是,上述两个问题之间的理论关联尚未得到系统研究。本文从两个层面深入探讨这些问题:(1)当聚类与重构在同一层级上同时进行时,特征随机性与特征漂移之间存在一种权衡关系;(2)相较于传统的自编码器模型,GAE模型在图卷积操作和图解码结构设计的双重影响下,特征漂移问题更为显著。基于上述发现,我们对基于GAE的聚类方法进行了重新构型。所提出的方法包含两个核心组件:第一,设计了一个采样算子 $Ξ$,用于激活对噪声聚类分配的保护机制,从而缓解特征随机性问题;第二,提出一个校正算子 $Υ$,通过逐步将重构图转化为面向聚类目标的图结构,实现对特征漂移的纠正。作为主要优势,本方法显著提升了聚类的准确性和鲁棒性,且可无缝集成至现有的GAE模型中,具有良好的通用性与可扩展性。

重新思考用于属性图聚类的图自编码器模型 | 最新论文 | HyperAI超神经