il y a 11 jours

OpenGrok : Amélioration du traitement des données SNS grâce aux connaissances distillées et aux mécanismes masquants

Lumen AI, Zaozhuang No.28 Middle School, Shihao Ji, Zihui Song, Fucheng Zhong, Jisen Jia, Zhaobo Wu, Zheyi Cao, Tianhao Xu

Voir les détails de l'article

OpenGrok : Amélioration du traitement des données SNS grâce aux connaissances distillées et aux mécanismes masquants

Résumé

Ce rapport décrit l'approche novatrice de Lumen Labs pour le traitement des données provenant des services de réseaux sociaux (SNS). Nous exploitons la distillation de connaissances, en particulier une méthode de distillation simplifiée inspirée de l’acquisition de raisonnement par chaîne de pensée (CoT) de DeepSeek-R1, combinée à la technique de « prompt hacking », afin d’extraire des données d’entraînement pertinentes à partir du modèle Grok. Ces données sont ensuite utilisées pour affiner un modèle Phi-3-mini, enrichi d’un mécanisme de masquage spécifiquement conçu pour gérer les subtilités propres aux données SNS. Notre méthode atteint des performances de pointe (SOTA) sur plusieurs tâches de traitement des données SNS, surpassant les modèles existants tels que Grok, Phi-3 et GPT-4. Nous fournissons une analyse complète de notre approche, incluant des formulations mathématiques, des détails d’ingénierie, des études d’ablation et des évaluations comparatives.