HyperAIHyperAI

Command Palette

Search for a command to run...

QualityFlow: سير عمل وكيل لتركيب البرامج تحت سيطرة النماذج اللغوية الكبيرة فحوصات الجودة

Hu Yaojie ; Zhou Qiang ; Chen Qihong ; Li Xiaopeng ; Liu Linbo ; Zhang Dejiao ; Kachroo Amit ; Oz Talha ; Tripp Omer

الملخص

نقدم QualityFlow، وهي عملية عمل ديناميكية وكيلية لتركيب البرامج.باستخدام وصف باللغة الإنجليزية لمشكلة برمجية ومجموعة من اختبارات الوحدة،يهدف النموذج إلى تركيب البرنامج الصحيح الذي يحل المشكلةويمر من الاختبارات. تشمل QualityFlow وكلاء نماذج اللغات الكبيرة (LLM)الذين يشبهون فريق تطوير البرمجيات، بما في ذلك إنشاء الرموز، الاختبار، والتصحيح الذاتي.نقترح مدقق الجودة LLM، والذي يقوم بشكل صريح بـ "تخيل"ما إذا كانت تنفيذ البرامج المركبة ستتوافق مع اختبارات الوحدة.تقوم عمليات التحقق من الجودة بتحكم ديناميكي في عملية العمل، بما في ذلك إجراءات لتقديم الإجابة النهائية، توضيح تصريح المشكلة، وإعادة خطوات عملية العمل السابقة.تظهر تجاربنا أن مدقق الجودة يمكنه قبول أي برنامج صحيح بدقة، وتخفيف الاختبارات المركبة الخاطئة، ومنع انحراف محتمل في عملية العمل.يقيم QualityFlow أفضل النتائج الحالية في أربع مقاييس لتركيب البرامج: MBPP، HumanEval، والتقييمات الأشد صرامة من MBPP-EvalPlus و HumanEval-EvalPlus.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp