vor 14 Stunden

Technischer Bericht zu RecGPT

Chao Yi; Dian Chen; Gaoyang Guo; Jiakai Tang; Jian Wu; Jing Yu; Sunhao Dai; Wen Chen; Wenjun Yang; Yuning Jiang; Zhujin Gao; Bo Zheng; Chi Li; Dimin Wang; Dixuan Wang; Fan Li; Fan Zhang; Haibin Chen; Haozhuang Liu; Jialin Zhu; Jiamang Wang; Jiawei Wu; Jin Cui; Ju Huang; Kai Zhang; Kan Liu; Lang Tian; Liang Rao; Longbin Li; Lulu Zhao; Mao Zhang; Na He; Peiyang Wang; Qiqi Huang; Tao Luo; Wenbo Su; Xiaoxiao He; Xin Tong; Xu Chen; Xunke Xi; Yang Li; Yaxuan Wu; Yeqiu Yang; Yi Hu; Yinnan Song; Yuchen Li; Yujie Luo; Yujin Yuan; Yuliang Yan; Zhengyang Wang; Zhibo Xiao; Zhixin Ma; Zile Zhou

Details der Forschungsarbeit anzeigen

Abstract

Empfehlungssysteme zählen zu den einflussreichsten Anwendungen künstlicher Intelligenz und fungieren als entscheidende Infrastruktur, die Nutzer, Händler und Plattformen miteinander verbindet. Derzeitige industrielle Systeme basieren jedoch weitgehend auf historischen Ko-Vorkommnismustern und Log-Optimierungszielen, d. h. sie optimieren ausschließlich auf vergangene Nutzeraufenthalte, ohne den Nutzerintentionen explizit Rechnung zu tragen. Dieser Log-Anpassungsansatz führt häufig zu einer Überanpassung an eng begrenzte historische Präferenzen und vermag daher die sich entwickelnden sowie latenten Interessen der Nutzer nicht adäquat zu erfassen. Folglich verstärken solche Systeme Filterblasen und Phänomene im langen Schwanz, was letztlich die Nutzererfahrung beeinträchtigt und die Nachhaltigkeit des gesamten Empfehlungssystems gefährdet.Um diesen Herausforderungen zu begegnen, überdenken wir das grundsätzliche Designparadigma von Empfehlungssystemen und stellen RecGPT vor – einen Framework der nächsten Generation, der den Nutzerintentionen die zentrale Rolle im Empfehlungsprozess zuweist. Durch die Integration großer Sprachmodelle (Large Language Models, LLMs) in zentrale Phasen der Nutzerinteressen-Erkundung, Objektretrieval und Erklärungs-Generierung transformiert RecGPT den traditionellen Log-Anpassungsansatz in einen intentionenbasierten Prozess. Um allgemein nutzbare LLMs effizient und skaliert auf die spezifischen Anforderungen der Empfehlungsaufgaben auszurichten, integriert RecGPT ein mehrstufiges Trainingsparadigma, das eine durch Reasoning-Verbesserung gestärkte Vor-Ausrichtung sowie ein selbsttrainierendes Evolutionsverfahren beinhaltet, geleitet durch ein vom Menschen und LLM kooperativ betriebenes Beurteilungssystem. Derzeit ist RecGPT vollständig in der Taobao-App implementiert. Online-Experimente zeigen, dass RecGPT konsistente Leistungsverbesserungen für alle Beteiligten erzielt: Nutzer profitieren von einer erhöhten Inhaltsvielfalt und Zufriedenheit, Händler und Plattform gewinnen an Sichtbarkeit und Konversionen. Die umfassenden Verbesserungsergebnisse für alle Stakeholder bestätigen, dass ein LLM-getriebener, intentionenorientierter Entwurf ein nachhaltigeres und wechselseitig vorteilhaftes Empfehlungssystem fördern kann.