15 天前

打破同质性与异质性在半监督节点分类中的纠缠

Henan Sun, Xunkai Li, Zhengyu Wu, Daohan Su, Rong-Hua Li, Guoren Wang
打破同质性与异质性在半监督节点分类中的纠缠
摘要

近年来,图神经网络(GNNs)通过利用图数据库中的知识,在半监督节点分类任务中展现出卓越的性能。然而,大多数现有的GNN模型均基于同质性(homophily)假设,即相连节点更可能具有相似的特征分布和相同的标签。这一假设在越来越多的实际应用场景中已被证明存在局限性。与此相对,异质性(heterophily)则反映了相连节点之间的差异性,近年来在图学习领域受到广泛关注。为此,数据工程师致力于开发一种强大的GNN模型,能够在同质性和异质性两种图结构下均保持优异性能。尽管已有诸多尝试,但大多数现有GNN模型受限于无向图的结构约束,难以获得最优的节点表示。忽视有向边的存在,导致图表示质量下降,进而制约了GNN的表达能力。为解决这一问题,本文提出AMUD(Adaptive Modeling of Undirected and Directed graphs),从统计学角度量化节点特征分布与图拓扑结构之间的关系,为自适应地将自然图结构建模为无向图或有向图提供了重要指导,从而最大化后续图学习的收益。此外,我们进一步提出了自适应有向模式聚合(Adaptive Directed Pattern Aggregation, ADPA),作为AMUD框架下的新型有向图学习范式。实证研究表明,AMUD能够有效引导高效的图学习过程。在16个基准数据集上的大量实验结果表明,ADPA显著优于现有基线方法,平均性能提升达3.96个百分点,展现出卓越的性能表现。