HyperAIHyperAI
vor 13 Tagen

SWE-Debatte: Wettbewerbsfähiger Multi-Agenten-Debatte zur Lösung von Softwareproblemen

Han Li, Yuling Shi, Shaoxin Lin, Xiaodong Gu, Heng Lian, Xin Wang, Yantao Jia, Tao Huang, Qianxiang Wang
SWE-Debatte: Wettbewerbsfähiger Multi-Agenten-Debatte zur Lösung von Softwareproblemen
Abstract

Die Lösung von Problemen hat dank der fortgeschrittenen Schlussfolgerungsfähigkeiten großer Sprachmodelle (Large Language Models, LLMs) erhebliche Fortschritte gemacht. Kürzlich haben agentenbasierte Frameworks wie SWE-agent diesen Fortschritt weiter vorangetrieben, indem sie autonome, Werkzeug nutzende Agenten ermöglichten, um komplexe Aufgaben im Bereich der Softwareentwicklung zu bewältigen. Während bestehende agentenbasierte Ansätze zur Problemlösung hauptsächlich auf unabhängige Erkundungen der Agenten basieren, geraten sie oft in lokale Lösungen und erkennen nicht die Muster von Fehlern, die sich über verschiedene Teile des Codebases erstrecken. Um diese Einschränkung zu überwinden, schlagen wir SWE-Debate vor – ein wettbewerbsbasiertes Mehragenten-Debattensystem, das verschiedene Schlussfolgerungspfade fördert und eine konsolidierte Lokalisierung von Problemen ermöglicht. SWE-Debate erstellt zunächst mehrere Fehlerpropagationspfade als Vorschläge zur Lokalisierung, indem es einen Abhängigkeitsgraphen des Codes durchläuft. Anschließend organisiert es eine dreirunde Debatte zwischen spezialisierten Agenten, wobei jeder Agent eine unterschiedliche Schlussfolgerungs Perspektive entlang des Fehlerpropagationspfads verkörpert. Dieser strukturierte Wettbewerb ermöglicht es den Agenten, gemeinsam zu einem konsolidierten Reparaturplan zu gelangen. Schließlich wird dieser konsolidierte Reparaturplan in einen MCTS-basierten Agenten zur Codeänderung integriert, um den Patch zu generieren. Experimente auf der SWE-bench-Benchmark zeigen, dass SWE-Debate neue SOTA-Ergebnisse (State-of-the-Art) in offenen Agenten-Frameworks erzielt und die Baseline-Methoden deutlich übertrifft.