
摘要
知识图谱嵌入(Knowledge Graph Embedding, KGE)模型是表示与推理多关系数据的一种高效且广泛应用的方法。先前的研究表明,KGE模型对超参数设置较为敏感,且最优超参数的选择具有数据集依赖性。本文针对超大规模知识图谱中的超参数优化(Hyperparameter Optimization, HPO)问题展开研究,此类场景下评估单个超参数配置的代价过高。以往研究常通过采用各类启发式方法来规避这一成本,例如在子图上进行训练或减少训练轮数(epochs)。本文系统地探讨并评估了这些启发式方法以及其他低成本近似技术在性能与成本节约方面的有效性。基于研究发现,我们提出 GraSH——一种面向大规模KGE的高效多保真度超参数优化算法。该算法结合了图结构缩减与训练轮数缩减两种技术,并以多轮逐步提升保真度的方式运行。实验研究表明,GraSH在大规模图上实现了当前最优的性能表现,且整体计算成本极低,仅需完成三次完整的训练过程即可达成。