16 天前

记忆、分解,或保持朴素:用于点击率预测的最优特征交互方法学习

Fuyuan Lyu, Xing Tang, Huifeng Guo, Ruiming Tang, Xiuqiang He, Rui Zhang, Xue Liu
记忆、分解,或保持朴素:用于点击率预测的最优特征交互方法学习
摘要

点击率(Click-Through Rate, CTR)预测是商业推荐系统中的核心任务之一,其目标是在给定用户与物品特征的前提下,预测用户点击某一特定物品的概率。由于特征交互能够引入非线性关系,因此被广泛用于提升CTR预测模型的性能。如何有效建模特征交互,已成为学术界与工业界共同关注的重要问题。当前主流方法大致可分为三类:(1)朴素方法,不显式建模特征交互,仅使用原始特征;(2)记忆型方法,将特征交互显式视为新特征,并为其分配可训练的嵌入向量(embedding)进行记忆;(3)因子分解型方法,通过学习原始特征的隐向量,并借助因子分解函数隐式建模特征交互。已有研究表明,仅采用上述任一方法单独建模特征交互均存在局限性,因为不同类型的特征交互具有各自独特的特性。为解决这一问题,本文提出一种通用框架——OptInter,该框架能够为每一种特征交互自动选择最合适的建模方式。值得注意的是,多种先进的深度CTR模型均可视为OptInter的具体实例。为实现OptInter的功能,我们进一步设计了一种自动学习算法,可动态搜索并确定最优的建模策略。我们在四个大规模真实数据集上进行了广泛的实验验证。结果表明,OptInter相较于表现最佳的现有深度CTR基线模型,性能提升最高可达2.21%。与同样优于基线的内存型方法相比,OptInter在显著提升性能的同时,参数量减少高达91%。此外,我们通过多组消融实验深入分析了OptInter各组件的贡献与影响。最后,本文还对OptInter的预测结果进行了可解释性讨论,揭示了其在不同交互模式下的建模偏好与决策逻辑。