OpenGrok: تحسين معالجة بيانات الشبكات الاجتماعية باستخدام المعرفة المستخلصة وآليات شبيهة بالقناع

يُفصّل هذا التقرير النهج الجديد الذي اعتمدته لومين لابز لمعالجة بيانات خدمات التواصل الاجتماعي (SNS). نستفيد من تقنية استخلاص المعرفة، وبشكل خاص طريقة بسيطة للاستخلاص مستوحاة من اكتساب التفكير التسلسلي (CoT) في نموذج DeepSeek-R1، مع دمجها مع تقنية "اختراق النص التوجيهي" (prompt hacking) لاستخلاص بيانات تدريب ذات قيمة من نموذج جروك. تُستخدم هذه البيانات لتعديل نموذج Phi-3-mini بدقة، مع تزويد النموذج بآلية شبيهة بالقناع (mask-like mechanism) مصممة خصيصًا لمعالجة التفاصيل الدقيقة المميزة لبيانات SNS. تُظهر الطريقة المُقترحة أداءً متميزًا على مستوى الحد الأقصى (SOTA) في عدة مهام معالجة بيانات SNS، وتتفوّق على النماذج الحالية مثل جروك وPhi-3 وGPT-4. ونقدّم تحليلًا شاملاً لنهجنا، يشمل الصيغ الرياضية، والتفاصيل الهندسية، ودراسات التحليل التجريبي (ablation studies)، والتقييمات المقارنة.