
摘要
点击率(Click-Through Rate, CTR)预测是在线广告和推荐系统等网络应用中的核心任务,其输入特征通常以多字段(multi-field)形式存在。该任务的关键在于建模不同特征字段之间的交互关系。近年来提出的基于深度学习的模型普遍遵循一种通用范式:首先将原始的稀疏多字段特征映射为稠密的字段嵌入向量(field embedding vectors),然后简单地将这些向量拼接起来,输入到深度神经网络(DNN)或其他专门设计的网络中,以学习高阶特征交互。然而,这种对特征字段的简单非结构化组合方式,不可避免地限制了模型在足够灵活且显式地捕捉跨字段复杂交互关系方面的能力。在本工作中,我们提出一种直观的图结构表示方法来建模多字段特征:将每个特征字段视为图中的一个节点,不同字段之间通过边进行交互。因此,特征交互建模问题可转化为在对应图结构上对节点间交互关系的建模。为此,我们设计了一种新型模型——特征交互图神经网络(Feature Interaction Graph Neural Networks, Fi-GNN)。得益于图结构强大的表示能力,所提出的Fi-GNN模型不仅能以灵活且显式的方式建模复杂的特征交互,还能为CTR预测提供良好的可解释性。在两个真实世界数据集上的实验结果表明,该模型在性能上显著优于现有最先进方法。