13 天前

SWE-Exp:基于经验的软件问题解决

Silin Chen, Shaoxin Lin, Xiaodong Gu, Yuling Shi, Heng Lian, Longfei Yun, Dong Chen, Weiguo Sun, Lin Cao, Qianxiang Wang
SWE-Exp:基于经验的软件问题解决
摘要

近年来,大型语言模型(LLM)代理在软件问题修复方面取得了显著进展,得益于多代理协作、蒙特卡洛树搜索(MCTS)等先进方法的应用。然而,当前的代理仍表现为“无记忆的探索者”——将每个问题视为独立任务,无法保留或复用以往修复过程中的知识。这导致重复探索失败的路径,并错失将已验证有效的修复策略迁移至相似问题的良机。为解决这一问题,我们提出SWE-Exp,一种基于经验增强的方法,能够从先前代理的执行轨迹中提炼出简洁且可操作的经验,实现跨问题的持续学习。该方法构建了一个多维度的经验库,系统性地记录成功与失败的修复尝试。具体而言,它在不同抽象层次上提取可复用的问题修复知识,涵盖从高层次问题理解到具体代码修改的完整链条。实验结果表明,在开源代理框架下,SWE-Exp在SWE-bench-Verified基准上实现了当前最优的修复成功率(Pass@1达41.6%)。我们的方法建立了一种新范式:自动化软件工程代理能够系统性地积累并利用修复经验,从根本上将问题求解方式从试错式探索转变为以经验驱动的战略性修复。