HyperAIHyperAI
il y a 2 mois

INTERVENANT : Stimuler la capacité de codage des grands modèles linguistiques avec la chaîne interactive de réparation

Wang, Hanbin ; Liu, Zhenghao ; Wang, Shuo ; Cui, Ganqu ; Ding, Ning ; Liu, Zhiyuan ; Yu, Ge
INTERVENANT : Stimuler la capacité de codage des grands modèles linguistiques avec la chaîne interactive de réparation
Résumé

Ce document présente INTERVENOR (INTERactiVE chaiN Of Repair), un système conçu pour émuler les processus interactifs de réparation de code observés chez les humains, englobant à la fois le diagnostic et la réparation du code. INTERVENOR incite les grands modèles linguistiques (LLMs) à jouer des rôles distincts lors du processus de réparation de code, agissant tant en tant que Apprenti du Code que Professeur du Code. Plus précisément, l'Apprenti du Code est chargé de suivre les instructions pour générer ou réparer du code, tandis que le Professeur du Code est responsable de la création d'une Chaîne de Réparation (CoR) servant de guide à l'Apprenti du Code. Lors de la génération de la CoR, le Professeur du Code doit vérifier les codes générés par l'Apprenti du Code et réévaluer comment aborder les bugs de code en fonction des retours d'erreur reçus des compilateurs.Les résultats expérimentaux montrent que INTERVENOR dépasse les modèles de base, affichant des améliorations d'environ 18 % et 4,3 % par rapport à GPT-3.5 dans les tâches de génération et de traduction de code, respectivement. Nos analyses supplémentaires démontrent que la CoR est efficace pour éclaircir les raisons derrière les bugs et esquisser des plans de solution en langage naturel. Avec le retour des compilateurs de code, INTERVENOR peut identifier avec précision les erreurs syntaxiques et d'assertion et fournir des instructions précises pour corriger le code. Toutes les données et codes sont disponibles sur https://github.com/NEUIR/INTERVENOR

INTERVENANT : Stimuler la capacité de codage des grands modèles linguistiques avec la chaîne interactive de réparation | Articles de recherche récents | HyperAI