7 天前
SimpleX:一种用于协同过滤的简单而强大的基线方法
Kelong Mao, Jieming Zhu, Jinpeng Wang, Quanyu Dai, Zhenhua Dong, Xi Xiao, Xiuqiang He

摘要
协同过滤(Collaborative Filtering, CF)是推荐系统领域中广泛研究的核心课题。CF模型的训练通常依赖于三个关键组成部分:交互编码器、损失函数以及负采样策略。尽管现有大量研究聚焦于设计更强大的交互编码器,但损失函数的选择与负采样比例的影响尚未得到充分探索。本文研究表明,损失函数的设计与负采样比例同样至关重要。具体而言,我们提出了一种余弦对比损失(Cosine Contrastive Loss, CCL),并将其集成至一个简洁统一的CF模型——SimpleX中。我们在11个基准数据集上进行了大量实验,并与总共29种现有的CF模型进行了对比。令人惊讶的是,实验结果表明,在采用我们提出的CCL损失函数并配合较大的负采样比例时,SimpleX在性能上显著超越了多数复杂的先进模型(例如,在NDCG@20指标上相较LightGCN最高提升达48.5%)。我们相信,SimpleX不仅可作为一项简洁而强大的基线方法,推动未来协同过滤领域的研究发展,同时也为优化损失函数与负采样策略提供了新的研究方向。相关源代码将公开发布于 https://reczoo.github.io/SimpleX。