11 天前
OpenGrok:基于蒸馏知识与掩码机制的SNS数据处理增强
Lumen AI, Zaozhuang No.28 Middle School, Shihao Ji, Zihui Song, Fucheng Zhong, Jisen Jia, Zhaobo Wu, Zheyi Cao, Tianhao Xu

摘要
本报告详细阐述了Lumen Labs在处理社交网络服务(Social Networking Service, SNS)数据方面所提出的新方法。我们采用知识蒸馏技术,具体为一种受DeepSeek-R1模型中思维链(Chain-of-Thought, CoT)获取机制启发的简化蒸馏方法,并结合提示词攻击(prompt hacking)技术,从Grok模型中提取具有高价值的训练数据。这些数据随后被用于微调Phi-3-mini模型,该模型引入了一种类似掩码(mask-like)的机制,专门针对SNS数据特有的复杂性和细微差异进行优化。实验结果表明,该方法在多项SNS数据处理任务上达到了当前最优(State-of-the-Art, SOTA)性能,显著优于现有模型如Grok、Phi-3及GPT-4。本文提供了对所提方法的全面分析,涵盖数学建模、工程实现细节、消融实验以及与主流模型的对比评估。