11日前

AdsCVLR:スポンサードサーチにおける商業的視覚言語表現モデリング

{Qi Zhang, Weiwei Deng, Liangjie Zhang, Ruofei Zhang, Nan Duan, Boxin Shi, Si Li, Hao Sun, Zhaoju Li, Bochen Pang, Yuefeng Zhan, Chunhui Han, Yongjie Zhu}
要約

スポンサード検索広告(広告)は、消費者が検索エンジンで製品やサービスを検索する際に、検索結果の隣に表示される。検索広告の基盤となる関連性モデリングは、大きな研究課題と顕著な実用的価値を持つことから、近年注目を集めている。本論文では、ユーザーの検索クエリと商業広告の間の関連性を、マルチモーダル構造化情報に基づいてモデリングする、スポンサード検索におけるマルチモーダルモデリング問題に取り組む。この問題を解決するため、画像・テキストの補完的マルチモーダル入力を自然に拡張できるトランスフォーマー・アーキテクチャを提案する。具体的には、商業的視覚言語表現(AdsCVLR)に基づく広告データを用いたコントラスト学習を導入し、画像・テキスト特徴の強力な集約器として機能させる。さらに、画像、タイトル、販売者、説明など構造化情報を含む、48万件のラベル付きクエリ-広告ペアデータを備えた公開広告データセットを構築した。実証実験において、大規模な業界データセット上でAdsCVLRモデルを評価した結果、オンライン/オフライン両テストにおいて、本手法の優位性が確認された。

AdsCVLR:スポンサードサーチにおける商業的視覚言語表現モデリング | 最新論文 | HyperAI超神経