il y a un mois

OnePiece : Intégration de l'ingénierie du contexte et du raisonnement dans un système industriel de classement en cascade

Sunhao Dai Jiakai Tang Jiahua Wu Kun Wang Yuxuan Zhu Bingjun Chen Bangyang Hong Yu Zhao Cong Fu Kangle Wu

Résumé

Malgré l’intérêt croissant porté à reproduire le succès à grande échelle des grands modèles linguistiques (LLM) dans les systèmes industriels de recherche et de recommandation, la plupart des initiatives existantes restent limitées au simple transfert d’architectures Transformer, offrant uniquement des améliorations marginales par rapport aux modèles forts de recommandation fondés sur l’apprentissage profond (DLRM). Du point de vue des principes fondamentaux, les progrès des LLM ne s’expliquent pas uniquement par leur architecture, mais aussi par deux mécanismes complémentaires : l’ingénierie de contexte, qui enrichit les requêtes brutes par des indices contextuels afin d’optimiser l’exploitation des capacités du modèle, et le raisonnement multi-étapes, qui affine itérativement les sorties du modèle à travers des chemins de raisonnement intermédiaires. Or, ces deux mécanismes, ainsi que leur potentiel d’apporter des améliorations significatives, restent largement sous-exploités dans les systèmes industriels de classement.Dans cet article, nous proposons OnePiece, un cadre unifié qui intègre de manière fluide l’ingénierie de contexte et le raisonnement inspirés des LLM dans les modèles de récupération et de classement des pipelines industriels en cascade. OnePiece repose sur une architecture fondamentale purement Transformer et introduit trois innovations clés : (1) une ingénierie structurée du contexte, qui enrichit l’historique d’interaction par des signaux de préférence et de scénario, puis les intègre de manière unifiée dans une séquence d’entrée structurée et tokenisée, utilisable aussi bien pour la récupération que pour le classement ; (2) un raisonnement latent par blocs, qui confère au modèle la capacité de raffiner itérativement ses représentations et permet d’ajuster la bande passante du raisonnement en fonction de la taille des blocs ; (3) une formation progressive multi-tâches, qui exploite les chaînes de retour utilisateur pour superviser efficacement les étapes de raisonnement durant l’entraînement. OnePiece a été déployé dans la principale scène de recherche personnalisée de Shopee, où il a permis d’obtenir des gains en ligne constants sur plusieurs indicateurs clés d’activité, notamment une augmentation de plus de +2 % du GMV par utilisateur (GMV/UU) et une progression de +2,90 % des revenus publicitaires.

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA

GPU prêts à utiliser

Meilleurs prix

Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

OnePiece : Intégration de l'ingénierie du contexte et du raisonnement dans un système industriel de classement en cascade

Sunhao Dai Jiakai Tang Jiahua Wu Kun Wang Yuxuan Zhu Bingjun Chen Bangyang Hong Yu Zhao Cong Fu Kangle Wu6 more

Résumé

Construire l'IA avec l'IA

Hyper Newsletters

Sunhao Dai Jiakai Tang Jiahua Wu Kun Wang Yuxuan Zhu Bingjun Chen Bangyang Hong Yu Zhao Cong Fu Kangle Wu