Command Palette
Search for a command to run...
PIPer: إعداد البيئة على الجهاز من خلال التعلم المعزز عبر الإنترنت
Alexander Kovrigin Aleksandra Eliseeva Konstantin Grotov Egor Bogomolov Yaroslav Zharov

الملخص
إعداد البيئة — وهي عملية تهيئة النظام للعمل مع مشروع برمجي معين — تمثل تحديًا مستمرًا في هندسة البرمجيات (SE). يمكن أن تساعد طرق إعداد البيئة التلقائيّة المطوّرين من خلال توفير بيئات مهيأة بالكامل لمستودعات برمجية مختلفة دون الحاجة إلى تدخل يدوي. كما تسهم هذه الطرق في تمكين الباحثين في مجال هندسة البرمجيات من توسيع نطاق اختبارات الأداء القائمة على التنفيذ. ومع ذلك، تُظهر الدراسات الحديثة أن حتى أحدث نماذج الذكاء الاصطناعي الكبيرة (LLMs) تحقق نجاحًا محدودًا في أتمتة هذه المهمة. وللتغلب على هذا التحدي، قمنا بتحسين نموذج متخصص لمهام إعداد البيئة. وتم دمج التدريب المُراقب المُعدّل (Supervised Fine-Tuning) لتكوين سكريبتات Bash الصحيحة، مع التعلم التكراري المُكافئ (Reinforcement Learning with Verifiable Rewards - RLVR) لضبط النموذج على مهام إعداد البيئة. وعلى معيار EnvBench-Python، تمكّن طريقةنا النموذج Qwen3-8B (الذي يمكن تشغيله على الأجهزة الاستهلاكية) من تحقيق أداء يوازي الأداء المُحقَّق من قبل النماذج الأكبر حجمًا مثل Qwen3-32B وGPT-4o. يُمكن الاطلاع على كود التدريب ونقط التحقق (checkpoints) للنموذج عبر الإنترنت من خلال الرابط التالي: https://github.com/JetBrains-Research/PIPer.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.