11일 전
OpenGrok: 정제된 지식과 마스크 유사 메커니즘을 통한 SNS 데이터 처리 성능 향상
Lumen AI, Zaozhuang No.28 Middle School, Shihao Ji, Zihui Song, Fucheng Zhong, Jisen Jia, Zhaobo Wu, Zheyi Cao, Tianhao Xu

초록
이 보고서는 Lumen Labs가 소셜 네트워킹 서비스(SNS) 데이터 처리를 위한 혁신적인 접근 방식을 설명한다. 우리는 지식 증류(Knowledge Distillation) 기법을 활용하며, DeepSeek-R1의 CoT(사고 과정) 획득 방식에서 영감을 받은 간단한 증류 방법과 프롬프트 해킹(Prompt Hacking) 기술을 결합하여 Grok 모델로부터 유용한 학습 데이터를 추출한다. 추출된 데이터는 SNS 데이터의 특수성을 효과적으로 처리하기 위해 특별히 설계된 마스크 형태의 메커니즘을 갖춘 Phi-3-mini 모델의 미세 조정(fine-tuning)에 사용된다. 제안하는 방법은 여러 SNS 데이터 처리 과제에서 최신 기준(SOTA) 성능을 보이며, 기존의 Grok, Phi-3, GPT-4와 같은 모델들을 모두 상회한다. 본 연구에서는 수학적 공식, 엔지니어링 세부 사항, 제거 실험(Ablation Studies), 그리고 비교 평가를 포함한 포괄적인 분석을 제공한다.