Command Palette
Search for a command to run...
تقرير فني حول IQuest-Coder-V1
تقرير فني حول IQuest-Coder-V1
Abstract
في هذا التقرير، نقدّم سلسلة نماذج اللغة الكبيرة المخصصة للبرمجة IQuest-Coder-V1 (7B/14B/40B/40B-Loop)، وهي عائلة جديدة من النماذج الكبيرة للغة المخصصة للبرمجة (LLMs). وننتقل بeyond التمثيلات الثابتة للبرمجة، ونُقدّم نموذج التدريب متعدد المراحل القائم على "تدفق الكود"، الذي يُمكّن من التقاط التطوّر الديناميكي للمنطق البرمجي عبر مراحل مختلفة من خط أنابيب المعالجة. تم تطوير نماذجنا من خلال خط أنابيب تطوري، يبدأ بمرحلة التدريب المبدئي التي تشمل بيانات حقائق الكود، ومستودعات الكود، وبيانات اكتمال الكود. ثم نُطبّق مرحلة وسطية مخصصة تدمج مسارات التفكير والمسارات العاملة (agentic) في سياق بطول 32K، وتمتد على نطاق مستودعات الكود بسياق بطول 128K، بهدف بناء أسس منطقية عميقة. وبعد ذلك، تُكتمل النماذج بمرحلة ما بعد التدريب المخصصة لتعزيز القدرات البرمجية، والتي تُنقسم إلى طريقتين مخصصتين: المسار التفكيري (الذي يعتمد على التعلم القائم على التفكير - reasoning-driven RL) والمسار التوجيهي (المُحسّن لتقديم المساعدة العامة). تُحقّق سلسلة IQuest-Coder-V1 أداءً متفوّقًا على المستوى العالمي بين النماذج التنافسية في المحاور الحاسمة للذكاء البرمجي: هندسة البرمجيات العاملة ذاتية، والبرمجة التنافسية، واستخدام الأدوات المعقدة. ولمعالجة قيود النشر، تقدّم النسخة المُطوّرة IQuest-Coder-V1-Loop آلية تكرارية مصممة لتحسين التوازن بين قدرة النموذج وحجم النشر، مما يوفّر طريقًا مُحسّنًا بناءً على البنية المعمارية لتحقيق توازن فعّال بين الكفاءة والأداء. نؤمن بأن إطلاق سلسلة IQuest-Coder-V1، بما في ذلك السلسلة الكاملة المفتوحة للنقاط المرجعية (checkpoints) من النماذج الأساسية للتدريب الأولي حتى النماذج النهائية للتفكير والتعليم، سيُسهم في دفع عجلة البحث في مجال الذكاء البرمجي الذاتي والأنظمة العاملة الواقعية.الشكل 1. أداء نموذج IQuest-Coder-V1 على مختلف المعايير. تم احتساب الدرجة الخاصة بـ LiveCodeBench v6 من خلال نموذج IQuest-Coder-V1-40B-Loop-Thinking، بينما تم احتساب باقي الدرجات من نموذج IQuest-Coder-V1-40B-Loop-Instruct. تمثل الخط المستقيم المرسوم باللون البرتقالي المتوسط الحسابي للنماذج المختارة.