SWE-Debate : Débat multi-agents compétitif pour la résolution des problèmes logiciels

La résolution des problèmes a connu des progrès remarquables grâce aux capacités avancées de raisonnement des grands modèles linguistiques (LLM). Récemment, des cadres basés sur des agents, tels que SWE-agent, ont encore accru ces progrès en permettant à des agents autonomes utilisant des outils de s’attaquer à des tâches complexes en génie logiciel. Bien que les approches existantes de résolution de problèmes basées sur des agents reposent principalement sur des explorations indépendantes des agents, celles-ci sont souvent bloquées dans des solutions locales et échouent à identifier des motifs de problème s’étendant sur différentes parties de la base de code. Pour remédier à cette limitation, nous proposons SWE-Debate, un cadre de débat multi-agents compétitif qui encourage des voies de raisonnement diversifiées et permet une localisation des problèmes plus consolidée. SWE-Debate commence par générer plusieurs trajectoires de propagation des défauts, utilisées comme propositions de localisation, en parcourant un graphe de dépendance du code. Ensuite, il organise un débat en trois tours entre des agents spécialisés, chacun incarnant une perspective de raisonnement distincte le long de la trajectoire de propagation du défaut. Cette compétition structurée permet aux agents de converger collectivement vers un plan de correction consolidé. Enfin, ce plan consolidé est intégré à un agent de modification de code basé sur l’algorithme MCTS afin de générer le correctif. Des expériences menées sur le benchmark SWE-bench montrent que SWE-Debate atteint de nouveaux états de l’art dans les cadres d’agents open source et surpasse significativement les méthodes de référence.