17 天前
UniGAP:一种通用且自适应的图上采样方法以缓解节点分类任务中的过平滑问题
Xiaotang Wang, Yun Zhu, Haizhou Shi, Yongchao Liu, Chuntao Hong

摘要
在图数据领域,基于消息传递神经网络(Message Passing Neural Networks, MPNNs)或图Transformer的深度图神经网络常面临节点特征过度平滑的问题,这限制了其表达能力。为缓解该问题,已有大量涉及节点与边操作的上采样技术被提出。然而,这些方法通常依赖大量人工干预,导致性能欠佳,且缺乏通用的集成策略。在本研究中,我们提出UniGAP——一种通用且自适应的图数据上采样技术。该方法构建了一个统一的图上采样框架,可将当前大多数主流方法视为其特例。此外,UniGAP可作为即插即用的组件,无缝且自适应地集成至现有图神经网络(GNN)中,有效提升模型性能并缓解过度平滑问题。通过大量实验验证,UniGAP在多个数据集和评估指标上均显著优于传统的启发式数据增强方法。我们进一步分析了UniGAP作用下图结构的演化过程,识别出过度平滑发生的关键瓶颈,并揭示了该方法如何针对性地解决这一问题。最后,我们展示了将UniGAP与大语言模型(Large Language Models, LLMs)相结合的潜力,以进一步提升下游任务的性能。相关代码已开源,地址为:https://github.com/wangxiaotang0906/UniGAP