"Osmosis-Apply-1.7B: نموذج متخصص لتوفير عمليات دمج代码 دقيقة وباستخدام أقل للحوسبة"
شركة Osmosis AI أعلنت عن تحرير مصدر Osmosis-Apply-1.7B، وهو نموذج تم تعديله بدقة من نموذج Qwen3-1.7B ليؤدي مهام دمج الكود بشكل دقيق ومُهيكل. هذا النموذج يستلهم إلهامه من ميزات الوكلاء في بيئة التطوير المتكاملة (IDE) مثل ميزة "تطبيق فوري" في Cursor، حيث يتم تحسينه للقيام بتحرير الكود على مستوى الدوال بطريقة حساسة للسياق. مصمم خصيصًا لأعمال دمج الكود بينما تواجه النماذج اللغوية العامة تحديات في تطبيق الاختلافات (diffs) والدمج السياقي، تم تدريب Osmosis-Apply-1.7B بشكل محدد على تطبيق تعديلات هيكلية على مستوى الدالة أو الكتلة. يستقبل النموذج ثلاثة مدخلات هيكلية: (1) الكود الأصلي، (2) مجموعة التعديلات أو الاختلافات، و(3) تنسيق الدمج المتوقع. ثم يقوم بإرجاع كود معدل داخل علامات مضمومة داخل علامة . هذا التنسيق يتوافق مع توقعات الإنتاج ويُبسط عملية التحقق. التدريب وبُنية المكافآت تم تعديل Osmosis-Apply-1.7B باستخدام حوالي 100,000 ارتكاز (commit) من مجموعة بيانات commitpackft، والتي تمثل أقل من 15% من المجموعة الكاملة. تم بُنية كل عينة تدريبية لتُمثل سير عمل مُطور عملي. استخدم نظام ما بعد التدريب المعتمد على المكافآت: هذا النظام يعمل على تعزيز الخروجات عالية الدقة بينما يُتيح بعض المرونة في التنوع الأسلوبي، مما يُحاكي كيفية قيام مراجعات الكود في الممارسة العملية. نتائج المعايير خضعت Osmosis AI للنموذج لعملية معايير باستخدام 10,000 عينة من مجموعة بيانات commitpackft. أظهرت النقاط المُتوسطة للمكافآت أداءً قويًا مقارنة بالنماذج اللغوية الأكبر: | النموذج | نقطة المكافأة | |----------|----------------| | Osmosis-Apply-1.7B | 0.9805 | | Claude 4 Sonnet | 0.9328 | | GPT-3.5-turbo | 0.8639 | | Gemini-2.5-Flash | 0.7745 | تؤكد هذه النتائج قوة النموذج في تطبيق التغييرات المحلية مع الحفاظ على الدلالات، التنسيق، والهيكلية. دمج بروتوكول السياق النموذجي (MCP) ميزة أساسية في هذا النموذج هي دعمه الأصلي لبروتوكول السياق النموذجي (MCP)، مما يُمكّن من الاستدعاء السياقي الهيكلي باستخدام هياكل الملفات، أسماء الدوال، وعلامات التعديل. يتبع النموذج مواصفات apply-code MCP، مما يسمح باستخدامه السلس في أدوات سطر الأوامر (CLI) وأدوات الوكلاء في بيئة التطوير المتكاملة (IDE). يرجع التغييرات ضمن مستوى الدالة ويُعيّن التعديلات باستخدام علامات XML ذات الهيكلة الجيدة، مما يُبسط تتبع الاختلافات والتعامل مع الأدوات اللاحقة. أدوات المطور واستخداماتها أصدرت Osmosis AI أيضًا نسخة مرجعية تدعم الاستدلال المحلي ودمج الخدمات مثل vLLM أو Gulp Server. تشمل الأدوات أمثلة للاستخدام عبر سطر الأوامر، تطبيق خادم MCP، وإرشادات آمنة للنشر. من أهم استخدامات هذا النموذج: - تطبيق تعديلات الكود على مستوى الدالة بشكل دقيق. - دمج الكود مع الحفاظ على التوافق والهيكلية. - تبسيط عملية التحقق من صحة التعديلات باستخدام علامات XML. التنسيق والنشر يُخرج النموذج التعديلات مُضمّمة بعلامات و لضمان التوافق مع مدققات التحقق الآلية. تتوفر نسخ جاهزة للاستدلال في تنسيقات مختلفة مثل safetensors وGGUF لتحقيق نشر فعال. يمكن استضافة Osmosis-Apply-1.7B محليًا أو تشغيله في وضع كمي (quantized) لتحقيق استدلال مُحسّن على الأجهزة ذات الإمكانات المحدودة. الانتشار والرخصة يمكن الحصول على Osmosis-Apply-1.7B تحت رخصة Apache-2.0 ومستضاف على منصات Hugging Face وGitHub. يشمل الإصدار جميع النصوص اللازمة للاستدلال، أمثلة للنشر المتوافق مع MCP، وإرشادات للتنسيق الهيكلي. الخلاصة بات تحرير مصدر Osmosis-Apply-1.7B خطوة مهمة من شركة Osmosis AI لتلبية الاحتياجات الأساسية للنماذج التي تحرر الكود على مستوى الدوال مع الوعي بالهيكلية. على عكس النماذج الأساسية، يجمع هذا النموذج المُتخصص بين الحجم الصغير والدقة والتوافق مع التنسيق. يعتبر دمج بروتوكول السياق النموذجي، تعديله المعتمد على المكافآت، وبناءه نحو الدلالات السينتكتية عناصر رئيسية تجعله المرشح المثالي لأدوات المطورين في الحياة العملية. لمزيد من المعلومات، يمكنك زيارة صفحة المشروع على GitHub وHugging Face ومراجعة التفاصيل الفنية. يُنسب الفضل في هذا البحث إلى الباحثين المشاركين فيه. يمكنك أيضًا متابعتنا على Twitter وYouTube وSpotify ولا تنسَ الانضمام إلى مجتمع ML SubReddit بـ 100,000 عضو أو الاشتراك في نشرتنا الإخبارية.