HyperAIHyperAI
منذ 2 أشهر

البرمجة القائمة على التخطيط: مسار عمل نموذج لغوي كبير للبرمجة

Lei, Chao ; Chang, Yanchuan ; Lipovetzky, Nir ; Ehinger, Krista A.
البرمجة القائمة على التخطيط: مسار عمل نموذج لغوي كبير للبرمجة
الملخص

الأداء القوي للنماذج اللغوية الكبيرة (LLMs) يثير مناقشات واسعة حول تطبيقها في إنشاء الشفرات البرمجية. تشير الأبحاث الحديثة إلى أن التحسين المستمر للبرامج من خلال الاختبارات المرئية يمكن أن يعزز دقة إنشاء الشفرات في النماذج اللغوية الكبيرة. ومع ذلك، تعاني هذه الطرق من عدم كفاءة النماذج اللغوية الكبيرة وقدرتها المحدودة على الاستدلال. في هذا البحث، نقترح عملية برمجة لنموذج لغوي كبير (LPW) مصممة لتحسين كل من إنشاء الشفرات الأولي والتحسينات اللاحقة ضمن عملية عمل من مرحلتين مهيكلتين. تحديدًا، تتضمن مرحلة إنشاء الحل صياغة خطة حل، والتي يتم التحقق منها بعد ذلك من خلال الاختبارات المرئية لتحديد الحل باللغة الطبيعية المقصود. ثم، في المرحلة اللاحقة لتنفيذ الشفرة، يتم صياغة شفرة أولية وفقًا لخطة الحل وتحققها. إذا فشلت الشفرة المنشأة في الاختبارات المرئية، فإن التحقق من خطة الحل يعمل كحل مقصود لتوجيه عملية التحسين بشكل مستمر لإصلاح الأخطاء. بالمقارنة مع أفضل الأساليب الحالية عبر مجموعة متنوعة من النماذج اللغوية الكبيرة الموجودة حاليًا، تحسن LPW دقة العبور الأولى (Pass@1) بنسبة تصل إلى 16.4% على مقاييس إنشاء النصوص إلى الشفرات البرمجية المعترف بها جيدًا. كما حققت LPW أعلى دقة عبور أولى جديدة (Pass@1)، بلغت 98.2% على HumanEval، 84.8% على MBPP، 59.3% على LiveCode، 62.6% على APPS، و34.7% على CodeContest باستخدام GPT-4o كأساس لها. رمزنا متاح للعامة على الرابط التالي:https://github.com/you68681/lpw

البرمجة القائمة على التخطيط: مسار عمل نموذج لغوي كبير للبرمجة | أحدث الأوراق البحثية | HyperAI