مختبرات Inception تطلق Mercury: نموذج لغوي انتشاري لتحقيق كفاءة فائقة في توليد الكود البرمجي
مختصر المقال مقدمة في مجال الذكاء الاصطناعي التوليدي، الذي أثر بشكل كبير على تطوير البرمجيات عبر أتمتة مهام البرمجة المختلفة، من التكميل الآلي البسيط إلى الحلول البرمجية المعقدة، تواجه النماذج اللغوية التقليدية تحديات كبيرة بسبب اعتمادها على طرق التوليد التتابعية. هذه الطرق تقوم بتوقع رمز واحد تلو الآخر، مما يؤدي إلى عقبات تتعلق بالزمن الفعلي وكفاءة الأداء، خاصة في البيئات التفاعلية أو السيناريوهات التي تتطلب استجابة فورية. الوضع الحالي لمساعدي البرمجة المعتمدين على الذكاء الاصطناعي تستند المساعدات الحالية للبرمجة إلى هياكل متحولات (Transformers) تالية الترتيب. من أشهر هذه النماذج: GPT-4o Mini، Claude 3.5 Haiku، Gemini 2.0 Flash Lite، وCodestral. رغم أن هذه النماذج تحقق نتائج مpressive في المعايير القياسية للبرمجة، إلا أن طبيعتها التتابعية تحد من كفاءتها وسرعتها. عموماً، تصل سرعة هذه النماذج إلى حوالي 50 إلى 200 رمز في الثانية على الأجهزة المتطورة من نوع GPU. تقديم Mercury: نموذج لغوي كبير مبني على عملية التفتيت لتحسين البرمجة قدم باحثو مخبر Inception Labs نموذج Mercury، وهو عائلة جديدة من النماذج اللغوية الكبيرة التي تم تحسينها خصيصاً للتطبيقات البرمجية. يتألف Mercury Coder، أول نموذج في هذه العائلة، من نسختين متميزتين: Mercury Coder Mini وMercury Coder Small. تتميز هذه النماذج بدمج هياكل متحولات مع توليد متوازي للرموز، مما يعزز كثيراً من كفاءة الحساب والسرعة الكلية. حسب التقييمات المستقلة التي أجرتها شركة Artificial Analysis، حقق نموذج Mercury Coder Mini سرعة تبلغ 1,109 رمز في الثانية، بينما حقق نموذج Mercury Coder Small سرعة تبلغ 737 رمز في الثانية، مما يجعلهما أسرع بكثير من النماذج التالية للترتيب التقليدية. آلية التفتيت وراء توليد الرموز المتوازي في Mercury تعتمد نماذج Mercury على آليات التفتيت، حيث يتم تكرار تحسين المخرجات من الضوضاء العشوائية إلى بيانات متماسكة. على عكس النماذج التقليدية التي تتوقع الرموز تباعاً، تقوم نماذج Mercury بتكرار تحسين عدة رموز في آن واحد خلال كل دورة، مما يحسن الاستخدام الأمثل لوحدات معالجة الرسوميات (GPU). خلال التدريب، استخدمت نماذج Mercury مجموعات بيانات تتألف من تريليونات الرموز، تم الحصول عليها من الزحف الشامل للويب، البيانات الاصطناعية، والمستودعات الخاصة. يشمل بروتوكول التدريب على التفتيت عملية تقدمية لإضافة الضوضاء إلى البيانات النظيفة وعملية عكسية لتقليل هذه الضوضاء. يستخدم Mercury خسارة التفتيت المقللة للضوضاء، التي تمكن من تعديل الرموز بشكل متوازي، بالإضافة إلى دمج طرق التحفيز المستخدمة في النماذج التالية للترتيب، مثل التعلم بلا أمثلة (Zero-shot) والتعلم بإعدادات قليلة (Few-shot)، مما يضمن الاندماج السلس في سير العمل البرمجي المعتاد. دقة المعايير القياسية: تفوق نماذج Mercury في المهام البرمجية القياسية في اختبارات المعايير القياسية، حقق نموذج Mercury Coder Small دقة بنسبة 90.0% على اختبار HumanEval، وهو معيار قياسي للبرمجة بلغة Python، ودقة بنسبة 76.2% على MultiPL-E، وهو معيار قياسي يغطي عدة لغات برمجة مثل C++، Java، JavaScript، PHP، Bash، وTypeScript. كما أظهر نموذج Mercury Coder Mini تأدية قوية، بتحقيق دقة بنسبة 88.0% على HumanEval و74.1% على MultiPL-E. في المهام البرمجية التي تتطلب تعبئة الفراغات، والتي تعتبر أساسية للتكميل الآلي والبرمجة التفاعلية، تفوق نموذج Mercury Coder Small بتحقيق متوسط دقة بنسبة 84.8%,متجاوزاً حتى النماذج المحسنة للسرعة الخاصة مثل Codestral 2501 التي حققت 82.5%. تقييمات الباحثين والمستخدمين في تقييمات البشرية التي أجريت عبر منصة Copilot Arena، تم تصنيف نموذج Mercury Coder Mini في المرتبة الثانية من حيث تفضيل المستخدمين، متفوقاً على نماذج مablished مثل GPT-4o Mini وGemini 1.5 Flash، وأظهر زمن استجابة متوسط يبلغ 25 مللي ثانية فقط. كما أظهرت النماذج تأدية متميزة في اختبارات لغوية محددة، حيث حقق Mercury Coder Small دقة عالية في مختلف اللغات ضمن معيار MultiPL-E، مثل 82.0% في C++، 80.1% في Java، 83.9% في JavaScript، 78.3% في PHP، 50.1% في Bash، و82.6% في TypeScript. الخلاصة: السرعة العالية، الدقة، والتوافق مع سير العمل تشير النتائج إلى أن نماذج Mercury تحقق توازناً مثالياً بين السرعة العالية والدقة في المهام البرمجية، مما يجعلها خياراً ممتازاً للمطورين الذين يعملون في بيئات تفاعلية تتطلب استجابة فورية وكفاءة زمنية عالية. يمكن للمطورين الاستفادة من هذه التقنية لتحقيق زيادة كبيرة في الإنتاجية وتحسين جودة البرامج المطورة. تقييم الحدث من قبل المختصين يُعتبر تقديم نموذج Mercury خطوة هامة في تطوير الذكاء الاصطناعي التوليدي، حيث يوفر حلولاً فعالة للتحديات التي تواجهها النماذج التالية للترتيب. يرى الخبراء أن هذه التقنية قد تغير وجه البرمجة الآلية، مما يفتح الباب أمام تطبيقات جديدة ومبتكرة في مجال تطوير البرمجيات. نبذة عن Inception Labs Inception Labs هي شركة بحثية متخصصة في تطوير تقنيات الذكاء الاصطناعي المتطورة. تعمل الشركة على تحسين كفاءة النماذج اللغوية وتقديم حلول مبتكرة تهدف إلى تسهيل عملية تطوير البرمجيات وزيادة الإنتاجية للمطورين. تتميز Inception Labs بفريق بحثي دولي ومتخصص في مجالات الذكاء الاصطناعي والتعلم العميق. لمزيد من المعلومات، يمكن الاطلاع على الورقة البحثية لهذا المشروع، واستخدام واجهة برمجة التطبيقات (API) وتجربة الدردشة مع النموذج. جميع الحقوق في هذا البحث تعود للباحثين المشار إليهم في المشروع. يمكنك أيضاً متابعتنا على تويتر وانضم إلى مجموعتنا في Reddit التي تضم أكثر من 100,000 مشترك، واشترك في نشرتنا الإخبارية.