QualityFlow: سير عمل وكيل لتركيب البرامج تحت سيطرة النماذج اللغوية الكبيرة فحوصات الجودة

نقدم QualityFlow، وهي عملية عمل ديناميكية وكيلية لتركيب البرامج.باستخدام وصف باللغة الإنجليزية لمشكلة برمجية ومجموعة من اختبارات الوحدة،يهدف النموذج إلى تركيب البرنامج الصحيح الذي يحل المشكلةويمر من الاختبارات. تشمل QualityFlow وكلاء نماذج اللغات الكبيرة (LLM)الذين يشبهون فريق تطوير البرمجيات، بما في ذلك إنشاء الرموز، الاختبار، والتصحيح الذاتي.نقترح مدقق الجودة LLM، والذي يقوم بشكل صريح بـ "تخيل"ما إذا كانت تنفيذ البرامج المركبة ستتوافق مع اختبارات الوحدة.تقوم عمليات التحقق من الجودة بتحكم ديناميكي في عملية العمل، بما في ذلك إجراءات لتقديم الإجابة النهائية، توضيح تصريح المشكلة، وإعادة خطوات عملية العمل السابقة.تظهر تجاربنا أن مدقق الجودة يمكنه قبول أي برنامج صحيح بدقة، وتخفيف الاختبارات المركبة الخاطئة، ومنع انحراف محتمل في عملية العمل.يقيم QualityFlow أفضل النتائج الحالية في أربع مقاييس لتركيب البرامج: MBPP، HumanEval، والتقييمات الأشد صرامة من MBPP-EvalPlus و HumanEval-EvalPlus.