11 天前

AdsCVLR:赞助搜索中的商业视觉-语言表征建模

{Qi Zhang, Weiwei Deng, Liangjie Zhang, Ruofei Zhang, Nan Duan, Boxin Shi, Si Li, Hao Sun, Zhaoju Li, Bochen Pang, Yuefeng Zhan, Chunhui Han, Yongjie Zhu}
摘要

赞助搜索广告(广告)在消费者通过搜索引擎查找产品和服务时,会显示在搜索结果的旁边。作为搜索广告的核心基础,相关性建模因其重大的研究挑战和巨大的实际应用价值而受到越来越多的关注。本文针对赞助搜索中的多模态建模问题展开研究,旨在利用包含图像、标题、卖家、描述等多种模态结构化信息,对用户查询与商业广告之间的相关性进行建模。为解决该问题,我们提出了一种基于广告数据的商业视觉-语言表示框架(AdsCVLR),其采用Transformer架构并结合对比学习机制,能够自然地扩展Transformer编码器以融合互补的多模态输入,从而高效聚合图像与文本特征,形成强大的特征整合能力。此外,我们公开发布了一个大规模广告数据集,包含48万条标注的查询-广告配对数据,涵盖图像、标题、卖家、描述等结构化信息。在大规模工业数据集上的实证评估表明,AdsCVLR模型在离线与在线测试中均展现出显著优于现有方法的性能,验证了所提方法的有效性与优越性。

AdsCVLR:赞助搜索中的商业视觉-语言表征建模 | 最新论文 | HyperAI超神经