SWE-Debate: مناظرة متعددة الوكالات تنافسية لحل مشكلات البرمجيات

أحرزت عمليات حل المشكلات تقدماً ملحوظاً بفضل القدرات المتقدمة في الاستدلال التي توفرها النماذج اللغوية الكبيرة (LLMs). ومؤخراً، ساهمت الأطر القائمة على الوكالات، مثل SWE-agent، في دفع هذا التقدم قدماً من خلال تمكين وكالات مستقلة تستخدم أدوات لمعالجة المهام المعقدة في هندسة البرمجيات. وعلى الرغم من أن النماذج الحالية القائمة على الوكالات في حل المشكلات تعتمد بشكل رئيسي على استكشافات مستقلة من قبل الوكالات، إلا أنها غالبًا ما تعلق في حلول محلية، ولا تتمكن من تحديد أنماط المشكلات التي تمتد عبر أجزاء مختلفة من قاعدة الشفرة. وللتغلب على هذه القيود، نقترح SWE-Debate، وهي إطار مناقشة متعددة الوكالات تنافسية، تُشجع على مسارات استدلال متنوعة وتحقق تحسيناً في تحديد المواقع الدقيقة للمشكلات. يبدأ SWE-Debate بإنشاء عدة آثار لانتشار الأعطال كمقترحات لتحديد الموقع، وذلك من خلال استكشاف رسم بياني للاعتمادية في الشفرة. ثم ينظم مناقشة مكونة من ثلاث جولات بين وكالات متخصصة، كل منها يجسد منظوراً استدلالياً مميزاً على طول مسار انتشار العطل. ويتيح هذا التنافس المُنظَّم للوكالات التقارب التكاملي على خطة إصلاح موحدة. وأخيراً، يتم دمج هذه الخطة المُوحَّدة في وكالة تعديل الشفرة القائمة على خوارزمية MCTS لإنشاء التصحيحات (Patch). وأظهرت التجارب على معيار SWE-bench أن SWE-Debate تحقق نتائج جديدة على مستوى التقنيات الريادية في الأطر الوكيلية المفتوحة المصدر، وتتفوق على النماذج الأساسية بمدى كبير.