HyperAIHyperAI

Command Palette

Search for a command to run...

科学家推出通用优化方案,赋能图自编码器实现大规模链路预测新突破

北京大学马唯硕团队近日提出一套针对图自编码器(GAE)的普适性优化方案,显著提升了其在链路预测任务中的性能与效率。研究发现,经过系统性优化的GAE模型,不仅在斯坦福大学大规模数据集ogbl-ppa上取得排名第一的SOTA成绩,还在多个基准测试中超越了复杂度远高于它的先进模型。 该成果的核心贡献在于:一是构建了一个高效且性能卓越的GAE优化版本,验证了经典模型的巨大潜力;二是归纳出一套适用于以GAE为基础的链路预测模型的通用优化技术,为后续模型设计提供重要指导。审稿人高度评价该工作,认为“精心优化的简单模型可媲美甚至超越复杂模型”,并在原创性方面给予肯定。 研究团队指出,长期以来,图学习领域追求模型复杂性,导致大量新方法在未与充分优化的基线对比下发布,造成性能提升被高估。为此,他们聚焦于2010年代提出的GAE模型,通过引入线性卷积、正交初始化、点积预测等现代优化技术,并系统性地进行消融实验与参数调优,最终实现数十倍乃至上百倍的效率提升。 更关键的是,研究揭示了GAE在理论上表达能力受限的局限可通过特定设计突破:当使用正交初始化的节点表征与线性传播机制时,模型能有效保留公共邻居等关键结构信息,从而实现强大性能。这一发现为理解基础模型潜力提供了理论支撑。 该工作最初源于对负采样技术的研究,由本科实习生马唯硕主导推进,在导师张牧涵教授及团队支持下完成。其成果最终以论文形式投稿至信息与知识管理国际会议(CIKM),获得接收,并获两个“强烈接收”意见。研究团队认为,这一成果提醒AI社区:在追逐复杂模型的同时,不应忽视对基础架构的深度挖掘。 未来,团队计划将该优化框架拓展至动态图学习和图基础模型构建,进一步探索其在推荐系统等工业场景中的规模化应用价值。

相关链接