HyperAIHyperAI

Command Palette

Search for a command to run...

SWE-Debate:ソフトウェア問題解決のための競争的マルチエージェントディベート

Han Li Yuling Shi Shaoxin Lin Xiaodong Gu Heng Lian Xin Wang Yantao Jia Tao Huang Qianxiang Wang

概要

問題解決の分野は、大規模言語モデル(LLM)の高度な推論能力のおかげで著しい進展を遂げてきた。最近では、SWE-agent などのエージェントベースのフレームワークが、ツールを活用する自律的なエージェントを用いて複雑なソフトウェア工学タスクに取り組むことを可能にすることで、この進展をさらに推し進めている。しかし、既存のエージェントベースの問題解決手法は、主にエージェントの独立した探索に依拠しており、コードベースの異なる部分にまたがる問題パターンを捉えきれず、局所的な解に閉じこもってしまう傾向がある。この課題を解決するため、本研究では、多様な推論経路を促進し、より統合的な問題場所の特定を実現する、競争型マルチエージェントディベートフレームワーク「SWE-Debate」を提案する。SWE-Debateは、まずコード依存関係グラフを走査することで、複数の故障伝搬トレースを生成し、問題場所の候補とする。次に、故障伝搬トレースに沿った異なる推論視点を体現する専門エージェント間で3ラウンドのディベートを実施する。この構造化された競争を通じて、エージェントたちは協調的に統合的な修正計画に収束する。最終的に、この統合された修正計画は、MCTSに基づくコード修正エージェントに統合され、パッチの生成が行われる。SWE-benchベンチマークにおける実験の結果、SWE-Debateはオープンソースエージェントフレームワークにおいて新たな最良成績を達成し、従来手法と比べて大幅な性能向上を示した。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています