HyperAIHyperAI
منذ 2 أشهر

من الكود إلى الصحة: إغلاق الميل الأخير في توليد الكود باستخدام التصحيح الهرمي

Yuling Shi, Songsong Wang, Chengcheng Wan, Xiaodong Gu
من الكود إلى الصحة: إغلاق الميل الأخير في توليد الكود باستخدام التصحيح الهرمي
الملخص

بينما أحرزت نماذج اللغة الكبيرة خطوات كبيرة في توليد الرموز البرمجية، فإن معدل نجاح الرموز المُولَدة يعاني من عقبات بسبب الأخطاء الدقيقة التي غالبًا ما تتطلب تدخلًا بشريًّا لاجتياز الاختبارات، خاصة بالنسبة للمشاكل المعقدة. تتعامل الأنظمة الحالية القائمة على نماذج اللغة الكبيرة مع البرامج المُولَدة كوحدات متكاملة، مما يجعلها غير قادرة على معالجة الأخطاء بمستويات مختلفة من التفصيل، بدءًا من أخطاء النحو على مستوى منخفض وصولًا إلى عيوب الخوارزميات على مستوى عالي.في هذا البحث، نقدم نظام التصحيح متعدد المستويات (MGDebugger)، وهو نظام تصحيح رموز برمجية هرمي يعمل على عزل وتَحديد وإصلاح الأخطاء بمستويات مختلفة من التفصيل. يقوم MGDebugger بتقسيم الرموز البرمجية المشكوكة إلى هيكل شجري هرمي يتكون من دوال فرعية، حيث يمثل كل مستوى درجة معينة من التفصيل للأخطاء. أثناء عملية التصحيح، يقوم النظام بتحليل كل دالة فرعية وإصلاح الأخطاء بشكل تدريجي من الأسفل إلى الأعلى. لاختبار كل دالة فرعية بكفاءة، نقترح محاكي Python قائمة على نموذج اللغة الكبيرة (LLM-simulated Python executor)، الذي يتتبع تنفيذ الرمز ويتابع حالات المتغيرات الهامة لتحديد الأخطاء بدقة.أظهرت التجارب الواسعة أن MGDebugger يتفوق على الأنظمة الحالية للتصحيح، حيث حقق تحسنًا بنسبة 18.9% في الدقة مقارنة بالجيل الأولي في HumanEval ونسبة نجاح في الإصلاح بلغت 97.6% في HumanEvalFix. بالإضافة إلى ذلك، أثبت MGDebugger قدرته على إصلاح الأخطاء في فئات مختلفة ومستويات صعوبة متنوعة، مما يدل على متانته وكفاءته.

من الكود إلى الصحة: إغلاق الميل الأخير في توليد الكود باستخدام التصحيح الهرمي | أحدث الأوراق البحثية | HyperAI