HyperAIHyperAI

Command Palette

Search for a command to run...

من الكود إلى الصحة: إغلاق الميل الأخير في توليد الكود باستخدام التصحيح الهرمي

Yuling Shi Songsong Wang Chengcheng Wan Xiaodong Gu

الملخص

بينما أحرزت نماذج اللغة الكبيرة خطوات كبيرة في توليد الرموز البرمجية، فإن معدل نجاح الرموز المُولَدة يعاني من عقبات بسبب الأخطاء الدقيقة التي غالبًا ما تتطلب تدخلًا بشريًّا لاجتياز الاختبارات، خاصة بالنسبة للمشاكل المعقدة. تتعامل الأنظمة الحالية القائمة على نماذج اللغة الكبيرة مع البرامج المُولَدة كوحدات متكاملة، مما يجعلها غير قادرة على معالجة الأخطاء بمستويات مختلفة من التفصيل، بدءًا من أخطاء النحو على مستوى منخفض وصولًا إلى عيوب الخوارزميات على مستوى عالي.في هذا البحث، نقدم نظام التصحيح متعدد المستويات (MGDebugger)، وهو نظام تصحيح رموز برمجية هرمي يعمل على عزل وتَحديد وإصلاح الأخطاء بمستويات مختلفة من التفصيل. يقوم MGDebugger بتقسيم الرموز البرمجية المشكوكة إلى هيكل شجري هرمي يتكون من دوال فرعية، حيث يمثل كل مستوى درجة معينة من التفصيل للأخطاء. أثناء عملية التصحيح، يقوم النظام بتحليل كل دالة فرعية وإصلاح الأخطاء بشكل تدريجي من الأسفل إلى الأعلى. لاختبار كل دالة فرعية بكفاءة، نقترح محاكي Python قائمة على نموذج اللغة الكبيرة (LLM-simulated Python executor)، الذي يتتبع تنفيذ الرمز ويتابع حالات المتغيرات الهامة لتحديد الأخطاء بدقة.أظهرت التجارب الواسعة أن MGDebugger يتفوق على الأنظمة الحالية للتصحيح، حيث حقق تحسنًا بنسبة 18.9% في الدقة مقارنة بالجيل الأولي في HumanEval ونسبة نجاح في الإصلاح بلغت 97.6% في HumanEvalFix. بالإضافة إلى ذلك، أثبت MGDebugger قدرته على إصلاح الأخطاء في فئات مختلفة ومستويات صعوبة متنوعة، مما يدل على متانته وكفاءته.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp