11 天前
DeepLight:用于加速广告投放中点击率预测的深度轻量级特征交互
Wei Deng, Junwei Pan, Tian Zhou, Deguang Kong, Aaron Flores, Guang Lin

摘要
点击率(Click-Through Rate, CTR)预测是在线展示广告中的关键任务。基于嵌入(embedding)的神经网络模型被提出,旨在通过浅层组件学习显式特征交互,同时利用深层神经网络(DNN)组件捕捉深层特征交互。然而,这类复杂模型的预测推理速度较传统方法显著降低,通常至少慢数百倍。为解决生产环境中CTR预测带来的显著服务延迟和高内存占用问题,本文提出了一种名为 DeepLight 的框架,从三个方面实现CTR预测的加速:1)通过在浅层组件中显式搜索具有信息量的特征交互,提升模型推理效率;2)在DNN组件内部及层间层面,剪枝冗余的神经层与参数;3)增强嵌入层的稀疏性,以保留最具判别性的特征信号。通过上述综合优化,所提出的方法在Criteo数据集上实现了46倍的推理加速,在Avazu数据集上实现了27倍的加速,且未牺牲任何预测准确性。该成果为在生产环境中成功部署复杂的基于嵌入的神经网络模型用于广告投放提供了可行路径。