مايكروسوفت تطلق نموذج Mu المبتكر: أداء يضاهي Phi-3.5-mini ويحسن واجهة Windows الذكائية
في وقت متأخر من الليل، أعلنت شركة مايكروسوفت رسميًا عن أحدث إصداراتها من النماذج الصغيرة ذات المعالم القليلة، النموذج الإبداعي Mu. هذا النموذج يتميز بحجمه الصغير حيث لا يتجاوز عدد معالمه 330 مليونًا، ومع ذلك فإن أدائه يضاهي نموذج Phi-3.5-mini السابق، الذي يبلغ حجمه عشرة أضعاف حجم Mu. أحد الإنجازات البارزة لنموذج Mu هو قدرته على الاستجابة بسرعة تتجاوز 100 توكن في الثانية على أجهزة الكمبيوتر المحمولة التي تعمل دون اتصال بشبكة الإنترنت والمجهزة بوحدات معالجة الأعصاب (NPU)، وهو أمر نادر الحدوث في مجال النماذج الصغيرة. من بين الميزات الرئيسية لنموذج Mu هي إمكانية استخدامه كمساعد ذكي داخل نظام التشغيل Windows. يستطيع المستخدمون التحكم في إعدادات النظام من خلال إعطاء الأوامر بلغة طبيعية، مثل "أكبر حجم مؤشر الفأرة بعض الشيء، وضبط سطوع الشاشة"، مما يتيح للمساعد الذكي تحويل هذه الأوامر إلى عمليات نظام مباشرة بشكل دقيق وسريع، مما يزيد بشكل كبير من سهولة استخدام نظام التشغيل Windows. تركز هندسة نموذج Mu على التحسينات المتقدمة الموجهة للنشر المحلي الصغير، وهي مصممة خصيصًا لأجهزة Copilot+ PC المجهزة بوحدات NPU. تعتمد هذه الهندسة على معمارية Transformer ذات المفكِّك فقط، مع إدخال ثلاثة ابتكارات رئيسية. بالإضافة إلى ذلك، تم استخدام تقنيات تدريب متقدمة مثل جدول الانهيار المستقر المسبق ومحسن Muon لتحسين الأداء بشكل أكبر. خضعت عملية تدريب نموذج Mu لاستخدام GPU A100، حيث بدأ التدريب بمرحلة التعلم الأولي على مليارات التوكنيات التعليمية عالية الجودة لفهم القواعد والمعنى والمعارف العالمية للغة. لتحقيق الدقة العالية، استخدم النموذج تقنية التقطير المعرفي من نموذج Phi، مما أدى إلى تحقيق كفاءة معالم ملحوظة، حيث يبلغ حجمه فقط العشر من حجم Phi-3.5-mini مع الحفاظ على أداء مشابه. لتحسين استخدام Windows وتوفير تجربة مستخدم سلسة، خططت مايكروسوفت لدمج المساعد الذكي المستند إلى نموذج Mu في شريط البحث الحالي. يتطلب هذا تحقيق استجابة ذات تأخير منخفض للغاية لعدد كبير من الإعدادات المحتملة. بعد اختبار العديد من النماذج، أظهر Mu خصائصًا مثالية لهذا الغرض. رغم أن نموذج Mu الأساسي كان يعاني من انخفاض في الدقة بنسبة 50% دون التحسين الدقيق، إلا أن مايكروسوفت تمكنت من تجاوز هذه العقبة من خلال زيادة نطاق التدريب إلى 3.6 مليون عينة (بتزايد 1300 مرة) وتوسيع نطاق الإعدادات المتعاملة معها من حوالي 50 إعدادًا إلى مئات الإعدادات. استخدمت مايكروسوفت مجموعة من التقنيات، بما في ذلك تحسين التسميات الآلية، تعديل النصوص، حقن الضوضاء، وتقنيات العينات الذكية، لضمان أن نموذج Mu المحسن للمساعد الذكي يحقق الأهداف الجودوية. أظهرت الاختبارات أن المساعد الذكي المستند إلى نموذج Mu يتميز بتفوقه في فهم إعدادات Windows وتنفيذ العمليات، مع استجابة لا تتعدى 500 ميلي ثانية.