HyperAIHyperAI
منذ 11 أيام

AdsCVLR: نمذجة التمثيل البصري-اللغوي التجاري في البحث المُموَّل

{Qi Zhang, Weiwei Deng, Liangjie Zhang, Ruofei Zhang, Nan Duan, Boxin Shi, Si Li, Hao Sun, Zhaoju Li, Bochen Pang, Yuefeng Zhan, Chunhui Han, Yongjie Zhu}
الملخص

تظهر الإعلانات الممولة في محركات البحث بجانب نتائج البحث عندما يبحث المستهلكون عن منتجات وخدمات. وباعتبار نمذجة الصلة (relevance modeling) الأساس الأساسي للإعلانات الممولة، فقد لاقت اهتمامًا متزايدًا بسبب التحديات البحثية الكبيرة والقيمة العملية الهائلة التي تقدمها. في هذه الورقة البحثية، نتناول مشكلة النمذجة متعددة الوسائط في الإعلانات الممولة، والتي تُنمذج الصلة بين استعلام المستخدم والإعلانات التجارية باستخدام معلومات هيكلية متعددة الوسائط. ولحل هذه المشكلة، نقترح بنية مُعتمدة على مُحَوِّل (Transformer) تُسمى AdsCVLR (إعادة تمثيل بصري-لغوي تجاري للإعلانات)، تعتمد على تعلم تبايني (contrastive learning)، والتي تمتد بشكل طبيعي لتمكين مُشفِّر المُحَوِّل من استقبال إدخالات متعددة الوسائط المكملة، وتُشكّل مُجمّعًا قويًا لسمات الصورة والنص. كما نُقدّم أيضًا مجموعة بيانات إعلانية عامة، تتضمن 480 ألف زوج من البيانات المُصنّفة (query-ad) مع معلومات هيكلية تشمل الصورة، العنوان، البائع، الوصف، وغيرها. من الناحية التجريبية، قُمنا بتقييم نموذج AdsCVLR على مجموعة بيانات صناعية كبيرة، وأظهرت نتائج الاختبارات الحية والخارجية تفوق أسلوبنا على النماذج الأخرى.

AdsCVLR: نمذجة التمثيل البصري-اللغوي التجاري في البحث المُموَّل | أحدث الأوراق البحثية | HyperAI