摘要
点击率(Click-Through Rate, CTR)预测是推荐系统与在线广告等众多在线应用中的关键任务。该任务旨在基于高维输入特征,预测用户产生点击行为的概率。为避免繁琐的手工特征工程,CTR预测的核心问题在于实现输入特征的自动交互建模。因子分解机(Factorization Machine, FM)是一种有效建模二阶特征交互的方法。近年来,FM已被扩展用于建模高阶特征交互,例如xDeepFM和高阶因子分解机(Higher-Order Factorization Machine, HOFM)。然而,这些方法普遍存在计算复杂度高或依赖迭代运算的问题,导致时间和空间开销较大。为解决上述问题,本文基于牛顿恒等式(Newton's identities),将任意阶因子分解机表示为幂和(power sums)的形式。基于此,我们提出一种新型交互模型——交互机(Interaction Machine, IM)。IM是高阶FM的一种高效且精确的实现方式,其时间复杂度随特征交互阶数及特征域数量呈线性增长。借助IM,可极为简洁地实现任意阶特征交互。此外,我们将IM与深度神经网络相结合,构建出DeepIM模型,该模型在保持与xDeepFM相当甚至更优性能的同时,显著提升了计算效率。我们在两个真实世界数据集上进行了实验,结果充分验证了IM与DeepIM在预测效果与计算效率方面的优越性。