SWE-Exp : Résolution de problèmes logiciels pilotée par l'expérience

Les avancées récentes dans les agents fondés sur les grands modèles linguistiques (LLM) ont montré des progrès remarquables dans la résolution des problèmes logiciels, en exploitant des techniques avancées telles que la collaboration multi-agents et la recherche arborescente de Monte Carlo (MCTS). Toutefois, les agents actuels agissent comme des explorateurs sans mémoire : ils traitent chaque problème de manière indépendante, sans conserver ni réutiliser les connaissances tirées d'expériences antérieures de correction. Cette approche entraîne une exploration redondante des trajectoires infructueuses et fait manquer des opportunités d’adapter des méthodes de résolution éprouvées à des problèmes similaires. Pour remédier à ce défaut, nous proposons SWE-Exp, une approche renforcée par l’expérience, qui extrait des expériences concises et exploitables à partir des trajectoires antérieures des agents, permettant ainsi un apprentissage continu à travers les différents problèmes. Notre méthode introduit une banque d’expériences multifacettes, qui capture à la fois les tentatives de correction réussies et infructueuses. Plus précisément, elle extrait des connaissances réutilisables pour la résolution des problèmes à différents niveaux — allant de la compréhension globale du problème à des modifications spécifiques du code. Les expériences montrent que SWE-Exp atteint un taux de résolution de pointe (41,6 % de succès à Pass@1) sur le benchmark SWE-bench-Verified, dans le cadre de cadres d’agents open-source. Notre approche établit un nouveau paradigme selon lequel les agents d’ingénierie logicielle automatisés accumulent systématiquement et exploitent de l’expertise en correction, passant fondamentalement d’une exploration par essai-erreur à une résolution stratégique pilotée par l’expérience.