
摘要
我们提出了一种无需使用辅助信息的归纳矩阵补全模型。通过将(评分)矩阵分解为低维潜在嵌入向量的乘积,这些向量分别对应行(用户)和列(项目),现有的大多数矩阵补全方法都是转换性的,因为学习到的嵌入向量无法推广到未见过的行/列或新的矩阵。为了实现矩阵补全的归纳性,以往的大部分工作都利用了内容(辅助信息),例如用户的年龄或电影的类型,来进行预测。然而,高质量的内容并不总是可用的,并且提取起来可能很困难。在极端情况下,除了需要补全的矩阵之外没有任何辅助信息可用时,我们是否仍然可以学习一个归纳矩阵补全模型?在本文中,我们提出了一个基于图的归纳矩阵补全(Inductive Graph-based Matrix Completion, IGMC)模型来解决这一问题。IGMC仅基于从评分矩阵生成的(用户,项目)对周围的1跳子图训练一个图神经网络(Graph Neural Network, GNN),并将这些子图映射到相应的评分上。该模型在性能上与最先进的转换性基线方法具有高度竞争力。此外,IGMC是归纳性的——它可以推广到训练过程中未见过的用户/项目(前提是它们存在交互关系),甚至可以迁移到新任务中。我们的迁移学习实验表明,从MovieLens数据集训练出的模型可以直接用于预测豆瓣电影评分,并表现出令人惊讶的良好性能。我们的研究展示了以下几点:1) 在不使用辅助信息的情况下训练归纳矩阵补全模型是可行的,并且其性能可与最先进的转换性方法相媲美或更好;2) (用户,项目)对周围的局部图模式是有效预测该用户对项目的评分;3) 长距离依赖关系可能不是建模推荐系统所必需的。