HyperAI
منذ 14 ساعات

تقرير تقني حول RecGPT

Chao Yi; Dian Chen; Gaoyang Guo; Jiakai Tang; Jian Wu; Jing Yu; Sunhao Dai; Wen Chen; Wenjun Yang; Yuning Jiang; Zhujin Gao; Bo Zheng; Chi Li; Dimin Wang; Dixuan Wang; Fan Li; Fan Zhang; Haibin Chen; Haozhuang Liu; Jialin Zhu; Jiamang Wang; Jiawei Wu; Jin Cui; Ju Huang; Kai Zhang; Kan Liu; Lang Tian; Liang Rao; Longbin Li; Lulu Zhao; Mao Zhang; Na He; Peiyang Wang; Qiqi Huang; Tao Luo; Wenbo Su; Xiaoxiao He; Xin Tong; Xu Chen; Xunke Xi; Yang Li; Yaxuan Wu; Yeqiu Yang; Yi Hu; Yinnan Song; Yuchen Li; Yujie Luo; Yujin Yuan; Yuliang Yan; Zhengyang Wang; Zhibo Xiao; Zhixin Ma; Zile Zhou
تقرير تقني حول RecGPT
الملخص

تُعد أنظمة التوصية من أكثر التطبيقات تأثيرًا للذكاء الاصطناعي، حيث تعمل كبنية تحتية حيوية تربط بين المستخدمين والتجار والمنصات. ومع ذلك، تظل معظم الأنظمة الصناعية الحالية تعتمد بشكل كبير على أنماط التوافر التاريخية وأهداف مطابقة السجلات (log-fitting)، أي أن تحسين الأداء يقتصر على تكرار التفاعلات السابقة للمستخدمين دون نمذجة صريحة لنية المستخدم. يؤدي هذا النهج المبني على مطابقة السجلات إلى تجاوز حدود التخصيص، مما يُضعف قدرة النظام على اكتشاف الاهتمامات المتغيرة والخفاية للمستخدمين. ونتيجة لذلك، يُعزز ظهور "فقاعات التصفية" وظاهرة الأطوال الطويلة (long-tail)، مما يضر بتجربة المستخدم ويهدد استدامة النظام الكلي لتوصية المحتوى.ولمعالجة هذه التحديات، نعيد التفكير في النموذج الشامل لتصميم أنظمة التوصية، ونقدم إطار RecGPT، وهو إطار من الجيل التالي يضع نية المستخدم في صميم عملية التوصية. من خلال دمج النماذج اللغوية الكبيرة (LLMs) في المراحل الرئيسية لاستخراج اهتمامات المستخدم، واسترجاع العناصر، وإنشاء التفسيرات، يحوّل RecGPT عملية التوصية القائمة على مطابقة السجلات إلى عملية مركزها نية المستخدم. ولضمان مواءمة فعّالة للنماذج اللغوية العامة (LLMs) مع المهام المتخصصة في مجال التوصية على نطاق واسع، يدمج RecGPT منهجية تدريب متعددة المراحل، تشمل التوافق الأولي المُعزز بالاستدلال، والتدرّب الذاتي التكاملي، وتحت إشراف نظام مُراقبة تعاوني بين الإنسان والنموذج اللغوي (Human-LLM cooperative judge system). في الوقت الحالي، تم نشر RecGPT بالكامل ضمن تطبيق تاوباو (Taobao App). وأظهرت التجارب الزمنية (online experiments) تحسّنًا متسقًا في الأداء بين جميع الأطراف المعنية: يحقق المستخدمون زيادة في تنوع المحتوى ورضاهم، بينما يحصل التجار والمنصة على تغطية أوسع وزيادة في التحويلات. وتُثبت هذه النتائج الشاملة للتحسينات بين جميع الأطراف أن التصميم القائم على الذكاء الاصطناعي القائم على نية المستخدم يمكنه دعم نظام توصية أكثر استدامة وفائدة متبادلة.