HyperAI

近日，北京大学马唯硕及其团队提出一套针对图自编码器（GAE）的普适性优化方案，显著提升了该模型在链路预测任务中的性能与效率。这一成果不仅使GAE在斯坦福大学发布的大型数据集ogbl-ppa上夺得排行榜第一，更揭示了一个重要事实：经过系统优化的简单模型，完全可媲美甚至超越复杂的先进模型。研究团队并未设计全新架构，而是聚焦于近十年来被广泛使用的GAE模型，通过引入一系列现代优化技术，包括线性卷积、正交初始化、精细参数调优以及高效的负采样策略等，系统性地重估其潜力。实验表明，优化后的GAE在多个基准数据集上实现了SOTA（State-of-the-Art）水平，且推理速度提升数十至百倍，大幅降低了计算开销。这一突破的关键意义在于，它打破了“高性能必伴随高复杂度”的惯性思维。在推荐系统、知识图谱等实际应用中，图结构常包含数十亿条边，对模型效率提出严苛要求。传统复杂图神经网络因计算成本过高难以规模化部署，而优化后的GAE凭借其简洁结构与高效实现，展现出极强的实用价值，为大规模图学习应用扫清了关键障碍。研究团队指出，长期以来，新模型的性能提升常被高估，原因在于对比基线多为未经优化的旧版本，导致评价体系失真。基于此，他们发起了一项反思性研究：若对经典模型进行系统性优化，是否仍能释放巨大潜力？答案是肯定的。通过深入分析近年领先模型的代码与设计逻辑，团队提炼出一套可复用的优化范式，涵盖表征初始化、传播机制与预测头设计等多个环节，为后续模型开发提供了清晰、可遵循的技术路径。理论层面，研究团队进一步解释了GAE为何能突破其表达能力受限的固有局限。他们发现，当采用正交初始化并结合线性传播与点积预测时，模型能够有效保留“公共邻居”等关键结构信号——这类信息对链路预测至关重要。这说明GAE的优异表现并非偶然，而是其内在机制在优化后被充分激活的结果。该工作最初源于团队对负采样技术的研究，后在导师张牧涵教授指导与团队协作下逐步深化。马唯硕作为本科实习生主导推进，通过大量消融实验与大规模验证，最终形成完整方案。论文投稿至信息与知识管理国际会议（CIKM），获得“强烈接收”评价，审稿人高度认可其原创性与实际价值。展望未来，团队计划将该优化框架拓展至动态图场景，并探索其在图基础模型构建中的应用潜力。这一研究不仅为图学习领域提供了更公允的性能评估基准，更提醒科研工作者：在追逐创新的同时，不应忽视对基础模型的深度挖掘与系统优化。真正的突破，往往藏于简单之中的精巧设计。

الروابط ذات الصلة

الروابط ذات الصلة

الروابط ذات الصلة

Command Palette

北大团队为图自编码器提出普适优化方案，显著提升链路预测模型效率与性能

الروابط ذات الصلة

Command Palette

北大团队为图自编码器提出普适优化方案，显著提升链路预测模型效率与性能

الروابط ذات الصلة

Command Palette

北大团队为图自编码器提出普适优化方案，显著提升链路预测模型效率与性能

الروابط ذات الصلة