深度神经网络助力电子商务广告排名超越传统模型:DoorDash案例分析
在将近十年的时间内,我见证了线上广告生态系统的演变,从简单的展示型策略发展到如今的复杂转化优化平台。让我们来探讨现代广告排名系统的工作原理以及其成功的关键因素。 线上广告平台的目标多样,包括提升品牌知名度、促销活动、促进转化和重新定向,这些目标的重要性依次增加。不同的定价模式如CPM(每千次展示成本)、CPC(每次点击成本)和CPA(每行动成本)分别与不同广告商的目标对齐。对于电子商务广告平台而言,如DoorDash和Airbnb,更看重的是转化而非展示次数或点击率,因此CPA(每行动成本)是一种非常有效的定价模型。这种模型确保了广告商只有在消费者完成特定行为(如购买、注册或订阅)时才需支付。 广告排名系统的核心在于预测广告展示后的转化率(CVR)。精确的CVR预测不仅可以提升广告质量排序,还能优化拍卖效率,保持市场的公平性,从而惠及广告商和消费者。然而,传统的树模型,尤其是梯度提升决策树(GBDT),尽管最初在大规模、高维和异构数据处理上表现出色,但最终效果趋于平稳,难以捕捉消费者交互的复杂性和多样性。 为了进一步提升电商广告排名的效果,企业开始转向深度学习,特别是深度神经网络(DNNs)。研究表明,DNNs在处理大规模异构数据方面具有明显优势,能够捕捉时间趋势、上下文信号和多模态输入(如文本、图像和图结构),并通过迁移学习分享跨领域的知识,以及通过多任务学习(MTL)构建整体用户行为模型。 以DoorDash为例,该公司的广告系统转型经历了几个重要阶段。首先是定义基线,包括离线模型训练服务和在线广告交换服务。为了确保平稳过渡,新解决方案需要满足关键性能标准。接着,DoorDash通过添加数据预处理层,优化CPU和GPU资源分配,极大地提高了训练吞吐量。在此基础上,公司探索了DNN特定架构设计和特征工程的机会,重点捕捉用户的重购买行为和对新选项的抗拒,以及订单时间对外部因素的影响,成功提升了约2.8%的转化率。 尽管如此, DoorDash仍面临一个4.3%的AUC差距问题,即离线训练模型与在线服务中的表现差异。通过调查发现,这一差距主要由线上记录的特征与离线结合的特征不一致引起,尤其是缓存值的陈旧性。为解决这些问题,DoorDash采取了一系列措施,包括实施特征延迟窗口、线上日志记录,以及基础设施升级和平行化关键流程(如竞标和CVR预测),最终将预测服务的负载增加了10%,但显著提高了广告排名质量和降低了平均延迟,证明转型的价值。 结论:深度神经网络正在成为传统树模型在电商广告排名领域的有力替代方案。DoorDash的成功案例展示了DNN在丰富特征表示、深化个性化和规模化训练上的能力,不仅提高了模型精度和转化率,还展示了如何通过适当的基础设施优化实现商业价值。 业内人士评价称,DoorDash在广告排名系统上的转型为业内树立了新的标杆,表明深度学习技术可以在大规模商业应用中发挥重要作用。门达什是一家领先的在线餐饮递送平台,拥有庞大的用户基础和技术实力,为其他寻求广告系统优化的企业提供了宝贵的经验。