13 天前

SWE-Debate:用于软件问题解决的竞争性多Agent辩论

Han Li, Yuling Shi, Shaoxin Lin, Xiaodong Gu, Heng Lian, Xin Wang, Yantao Jia, Tao Huang, Qianxiang Wang
SWE-Debate:用于软件问题解决的竞争性多Agent辩论
摘要

问题修复已因大型语言模型(LLMs)先进的推理能力而取得显著进展。近期,基于智能体的框架(如 SWE-agent)通过引入能够自主使用工具的智能体,进一步推动了这一进展,使其能够应对复杂的软件工程任务。然而,现有的基于智能体的问题修复方法主要依赖于智能体的独立探索,往往陷入局部解,难以识别跨越代码库多个部分的缺陷模式。为解决这一局限性,我们提出 SWE-Debate——一种竞争性多智能体辩论框架,旨在激发多样化的推理路径,实现更精准的问题定位。SWE-Debate 首先通过遍历代码依赖图,生成多个故障传播路径作为定位候选方案;随后,组织三个回合的辩论,由具备不同推理视角的专用智能体围绕故障传播路径展开讨论。这种结构化的竞争机制促使智能体协同收敛至一个统一的修复方案。最终,该统一的修复方案被整合进基于 MCTS(蒙特卡洛树搜索)的代码修改智能体,用于生成补丁。在 SWE-bench 基准上的实验表明,SWE-Debate 在开源智能体框架中达到了新的最先进水平,显著优于现有基线方法。