12 天前

学习文献网络中研究模式的多分辨率表征

{Jason J. Jung, Hyeon-Ju Jeon, O-Joun Lee}
摘要

本研究旨在通过固定长度的向量表示文献实体(如学者、论文和学术会议等)的研究模式。文献网络结构以这些实体为核心,其复杂性极为丰富,且在表现卓越的实体中尤为显著。然而,尽管这些卓越实体数量庞大,其可获得的学习机会却极为有限;相反,表现平庸的实体则被过度代表。为解决这一问题,本研究不再追求对个体实体进行精确刻画,而是聚焦于捕捉实体所体现的研究模式。首先,我们采用Weisfeiler–Lehman(WL)重标记算法描述以实体为中心的网络结构。该算法生成的每个子图均包含关于学者的信息,包括其发表论文的类型、论文发表的学术会议标准,以及合作者的类型等。我们假设,每个子图能够反映文献实体的研究模式,例如某位学者倾向于发表少数高影响力论文,还是大量中等影响力论文。随后,我们根据多层级的抽象程度对这些子图进行简化。原始子图保留了实体的个体特征,而简化后的子图则代表具有相同研究模式的实体集合。通过这种方式,简化子图实现了高绩效与低绩效实体之间的共现,从而在学习过程中平衡了两类实体的代表性与学习机会。接着,我们采用Skip-Gram方法对子图进行嵌入表示。若嵌入结果确实捕捉了实体的研究模式,则所获得的向量应能有效表征实体在短期与长期维度下的多种研究绩效特征,而不论其绩效水平高低。为此,我们仅基于向量表示,对四个绩效群体(前1%、前5%、前10%及全部实体)在四个时间周期内共23项绩效指标进行了预测实验。实验结果表明,所提出的模型在预测准确率与结果方差方面均优于现有的网络嵌入方法。

学习文献网络中研究模式的多分辨率表征 | 最新论文 | HyperAI超神经