
摘要
点击率(Click-Through Rate, CTR)预测在推荐系统与在线广告中扮演着至关重要的角色。为了提升CTR模型的预测性能,有效建模特征之间的交互关系尤为关键。然而,现有方法面临三大挑战:首先,尽管多数方法能够自动捕捉高阶特征交互,但随着特征交互阶数的增加,其性能往往显著下降;其次,现有方法缺乏对预测结果的可信解释能力,尤其在高阶特征交互方面,这限制了模型预测结果的可信赖性;第三,许多方法存在冗余参数问题,尤其是在嵌入层中,导致模型复杂度高、泛化能力受限。针对上述问题,本文提出一种新型方法——门控深度交叉网络(Gated Deep Cross Network, GDCN),并引入一种场级维度优化(Field-level Dimension Optimization, FDO)策略。GDCN的核心结构为门控交叉网络(Gated Cross Network, GCN),该结构能够显式地捕捉高阶特征交互,并在每一阶交互中通过信息门机制动态筛选出重要的交互项,从而提升模型表达能力。此外,FDO策略根据各特征字段的重要性,自适应地学习其压缩后的低维表示,有效降低模型参数量并提升特征表示效率。在五个公开数据集上的大量实验结果表明,GDCN在预测性能、模型优越性以及可解释性方面均表现优异。同时,我们验证了FDO在学习多样化特征维度和显著减少模型参数方面的有效性。相关代码已开源,可访问:\url{https://github.com/anonctr/GDCN}。