HyperAIHyperAI

Command Palette

Search for a command to run...

منذ شهر واحد

PIPer: إعداد البيئة على الجهاز من خلال التعلم المعزز عبر الإنترنت

Alexander Kovrigin Aleksandra Eliseeva Konstantin Grotov Egor Bogomolov Yaroslav Zharov

PIPer: إعداد البيئة على الجهاز من خلال التعلم المعزز عبر الإنترنت

الملخص

إعداد البيئة — وهي عملية تهيئة النظام للعمل مع مشروع برمجي معين — تمثل تحديًا مستمرًا في هندسة البرمجيات (SE). يمكن أن تساعد طرق إعداد البيئة التلقائيّة المطوّرين من خلال توفير بيئات مهيأة بالكامل لمستودعات برمجية مختلفة دون الحاجة إلى تدخل يدوي. كما تسهم هذه الطرق في تمكين الباحثين في مجال هندسة البرمجيات من توسيع نطاق اختبارات الأداء القائمة على التنفيذ. ومع ذلك، تُظهر الدراسات الحديثة أن حتى أحدث نماذج الذكاء الاصطناعي الكبيرة (LLMs) تحقق نجاحًا محدودًا في أتمتة هذه المهمة. وللتغلب على هذا التحدي، قمنا بتحسين نموذج متخصص لمهام إعداد البيئة. وتم دمج التدريب المُراقب المُعدّل (Supervised Fine-Tuning) لتكوين سكريبتات Bash الصحيحة، مع التعلم التكراري المُكافئ (Reinforcement Learning with Verifiable Rewards - RLVR) لضبط النموذج على مهام إعداد البيئة. وعلى معيار EnvBench-Python، تمكّن طريقةنا النموذج Qwen3-8B (الذي يمكن تشغيله على الأجهزة الاستهلاكية) من تحقيق أداء يوازي الأداء المُحقَّق من قبل النماذج الأكبر حجمًا مثل Qwen3-32B وGPT-4o. يُمكن الاطلاع على كود التدريب ونقط التحقق (checkpoints) للنموذج عبر الإنترنت من خلال الرابط التالي: https://github.com/JetBrains-Research/PIPer.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
PIPer: إعداد البيئة على الجهاز من خلال التعلم المعزز عبر الإنترنت | الأوراق البحثية | HyperAI