11 天前

TF4CTR:基于自适应样本差异化的点击率预测双焦点框架

Honghao Li, Yiwen Zhang, Yi Zhang, Lei Sang, Yun Yang
TF4CTR:基于自适应样本差异化的点击率预测双焦点框架
摘要

在工业级推荐系统中,有效建模特征交互对于提升点击率(Click-Through Rate, CTR)预测的准确性至关重要。当前大多数深度CTR模型通过构建复杂的网络架构,以更好地捕捉复杂的特征交互关系或用户行为模式。然而,我们发现这些模型存在两个关键局限性:(1)输入模型的样本缺乏区分性,导致模型倾向于单一地学习大量简单样本,而忽视数量较少但更具挑战性的困难样本,从而削弱了模型的泛化能力;(2)尽管设计了差异化的特征交互编码器以捕捉不同类型的交互信息,但所有编码器接收的监督信号一致,限制了编码器的表达效能。为解决上述问题,本文提出一种新型CTR预测框架——Twin Focus Framework for CTR(TF4CTR),该框架融合了即插即用的双焦点(Twin Focus, TF)损失函数、样本选择嵌入模块(Sample Selection Embedding Module, SSEM)以及动态融合模块(Dynamic Fusion Module, DFM)。具体而言,框架在模型底层引入SSEM,对样本进行差异化处理,为每个样本自动分配更合适的编码器;同时,TF损失函数为简单样本和复杂样本分别提供定制化的监督信号,增强模型对不同难度样本的学习能力。此外,DFM动态融合各编码器所提取的特征交互信息,进一步提升预测精度。在五个真实世界数据集上的实验结果验证了该框架的有效性与良好的兼容性,表明其能够以模型无关的方式显著提升多种代表性基线模型的性能。为促进可复现研究,本文已将开源代码及详细的运行日志发布于:https://github.com/salmon1802/TF4CTR。

TF4CTR:基于自适应样本差异化的点击率预测双焦点框架 | 最新论文 | HyperAI超神经