11 天前
FLEN:利用领域实现可扩展的点击率预测
Wenqiang Chen, Lizhang Zhan, Yuanlong Ci, Minghua Yang, Chen Lin, Dugang Liu

摘要
点击率(Click-Through Rate, CTR)预测是众多工业应用中不可或缺的核心组件,广泛应用于推荐系统与在线广告等领域。CTR预测系统通常基于多字段类别型特征,即每个特征均为类别型,且仅归属于一个特定字段。准确建模特征之间的交叉关系对于提升CTR预测精度至关重要。然而,若显式地建模所有特征交叉组合,将需要庞大的参数量,这在真实生产环境中难以实现可扩展性。本文提出一种新型的场增强嵌入网络(Field-Leveraged Embedding Network, FLEN),该模型已成功部署于美图(Meitu)的商业推荐系统中,并承担主要流量服务。FLEN创新性地引入了一种基于场的双向交互池化(field-wise bi-interaction pooling)机制。通过合理利用字段信息,该机制能够在参数量极少、计算复杂度可控的前提下,同时捕捉字段间与字段内的特征交叉关系,满足工业级应用对效率与性能的双重需求。我们进一步证明,多种前沿的CTR预测模型均可在该技术框架下进行统一表达。此外,本文还提出DiceFactor——一种新型的Dropout技术,旨在防止独立的潜在特征之间发生共适应(co-adaptation)问题,从而提升模型泛化能力。大量实验验证了FLEN的有效性与高效性,涵盖离线评估与在线A/B测试,均在真实生产系统中展开。实验结果表明,相较于上一版本模型(即NFM),FLEN在CTR指标上实现了5.19%的显著提升,同时仅需1/6的内存占用与计算时间,充分展现了其在实际应用中的优越性能与高性价比。