HyperAIHyperAI

Command Palette

Search for a command to run...

QualityFlow : Un flux de travail agencé pour la synthèse de programmes contrôlé par LLM Contrôles de qualité

Hu Yaojie ; Zhou Qiang ; Chen Qihong ; Li Xiaopeng ; Liu Linbo ; Zhang Dejiao ; Kachroo Amit ; Oz Talha ; Tripp Omer

Résumé

Nous présentons QualityFlow, un flux de travail dynamique et agencé pour la synthèse de programmes. Étant donné une description en anglais d'un problème de programmation et un ensemble de tests unitaires, l'objectif du modèle est de synthétiser le programme correct qui résout le problème et passe les tests. QualityFlow inclut des agents de grands modèles linguistiques (LLM) ressemblant à une équipe de développement logiciel, comprenant la génération de code, les tests et l'autodebogage. Nous proposons le Vérificateur Qualité LLM, qui « imagine » explicitement si l'exécution des programmes synthétisés serait conforme aux tests unitaires. Les Vérifications Qualité contrôlent dynamiquement le flux de travail, y compris les actions pour soumettre la réponse finale, clarifier l'énoncé du problème et annuler les étapes précédentes du flux de travail. Nos expériences montrent que le Vérificateur Qualité peut accepter précisément tout programme correct, atténuer les tests synthétisés erronés et prévenir les déviations potentielles du flux de travail. QualityFlow établit des résultats d'état de l'art sur quatre benchmarks de synthèse de programmes : MBPP, HumanEval et des évaluations plus strictes provenant de MBPP-EvalPlus et HumanEval-EvalPlus.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp