
摘要
推荐系统中的神经网络方法通过将大量物品表示为可学习的向量嵌入表,取得了显著成功。然而,对于出现频率较低的物品,由于训练机会不足,难以学习到有意义的表示。我们发现,在考虑物品属性和上下文信息的场景下,低频物品学习不佳的嵌入表示会显著降低推荐的准确性。为解决这一问题,我们提出一种基于代理(proxy)的物品表示方法,使每个物品均可表示为可学习的代理嵌入的加权和。其中,代理权重由物品的属性和上下文信息决定,并可为高频物品引入偏置项,以进一步捕捉协同信号。该代理方法以组合方式计算物品表示,确保每个表示均位于一个训练良好的单纯形(simplex)内部,从而保证了表示质量的可靠性。此外,由于代理嵌入在所有物品间共享,低频物品能够以统一的模型结构和端到端的方式,借用高频物品的训练信号。所提出的模型是一种即插即用的架构,可直接替换任意基于神经网络的推荐模型中的物品编码层,在显著减少参数量的同时,持续提升推荐性能。在真实世界推荐基准数据集上的实验表明,我们的模型在推荐准确率上相比现有最先进方法最高提升达17%,且仅使用其10%的参数量。