Technischer Bericht zu RecGPT

Empfehlungssysteme zählen zu den einflussreichsten Anwendungen künstlicher Intelligenz und fungieren als entscheidende Infrastruktur, die Nutzer, Händler und Plattformen miteinander verbindet. Derzeitige industrielle Systeme basieren jedoch weitgehend auf historischen Ko-Vorkommnismustern und Log-Optimierungszielen, d. h. sie optimieren ausschließlich auf vergangene Nutzeraufenthalte, ohne den Nutzerintentionen explizit Rechnung zu tragen. Dieser Log-Anpassungsansatz führt häufig zu einer Überanpassung an eng begrenzte historische Präferenzen und vermag daher die sich entwickelnden sowie latenten Interessen der Nutzer nicht adäquat zu erfassen. Folglich verstärken solche Systeme Filterblasen und Phänomene im langen Schwanz, was letztlich die Nutzererfahrung beeinträchtigt und die Nachhaltigkeit des gesamten Empfehlungssystems gefährdet.Um diesen Herausforderungen zu begegnen, überdenken wir das grundsätzliche Designparadigma von Empfehlungssystemen und stellen RecGPT vor – einen Framework der nächsten Generation, der den Nutzerintentionen die zentrale Rolle im Empfehlungsprozess zuweist. Durch die Integration großer Sprachmodelle (Large Language Models, LLMs) in zentrale Phasen der Nutzerinteressen-Erkundung, Objektretrieval und Erklärungs-Generierung transformiert RecGPT den traditionellen Log-Anpassungsansatz in einen intentionenbasierten Prozess. Um allgemein nutzbare LLMs effizient und skaliert auf die spezifischen Anforderungen der Empfehlungsaufgaben auszurichten, integriert RecGPT ein mehrstufiges Trainingsparadigma, das eine durch Reasoning-Verbesserung gestärkte Vor-Ausrichtung sowie ein selbsttrainierendes Evolutionsverfahren beinhaltet, geleitet durch ein vom Menschen und LLM kooperativ betriebenes Beurteilungssystem. Derzeit ist RecGPT vollständig in der Taobao-App implementiert. Online-Experimente zeigen, dass RecGPT konsistente Leistungsverbesserungen für alle Beteiligten erzielt: Nutzer profitieren von einer erhöhten Inhaltsvielfalt und Zufriedenheit, Händler und Plattform gewinnen an Sichtbarkeit und Konversionen. Die umfassenden Verbesserungsergebnisse für alle Stakeholder bestätigen, dass ein LLM-getriebener, intentionenorientierter Entwurf ein nachhaltigeres und wechselseitig vorteilhaftes Empfehlungssystem fördern kann.