Command Palette
Search for a command to run...
AgentFold: وكالات ويب ذات مدى طويل مع إدارة استباقية للسياق
AgentFold: وكالات ويب ذات مدى طويل مع إدارة استباقية للسياق
الملخص
تُظهر الوكلاء الويب القائمة على النماذج الكبيرة للغة (LLM) إمكانات هائلة في مجال البحث عن المعلومات، إلا أن فعاليتها في المهام ذات الأفق الطويل تُعاني من تناقض أساسي في إدارة السياق. فتُعاني الوكلاء القائمة على منهجية ReAct السائدة من امتلاء السياق الناتج عن تراكم سجلات تاريخية ضوضائية وخامّة، في حين أن الطرق التي تقوم بتلخيص السجل الكامل بشكل ثابت في كل خطوة تُعرّض لفقدان دائم لتفاصيل حرجة. ولحل هذه التحديات، نقدّم "AgentFold"، نموذجًا جديدًا للوكلاء يرتكز على إدارة سياق استباقية، مستوحى من العملية الإدراكية البشرية للتأمل التراجعي. يُعامل AgentFold سياقه كمساحة إدراكية ديناميكية يمكن تشكيلها بنشاط، بدلًا من كونه سجلًا سلبيًا يُملأ تدريجيًا. في كل خطوة، يتعلم تنفيذ عملية "طيّ" (folding)، التي تُدير المسار التاريخي للوكلاء على مقياس متعدد المستويات: حيث يمكنه إجراء عمليات تلخيص دقيقة لحفظ التفاصيل المهمة والدقيقة، أو تلخيصات عميقة لاستخلاص مهام فرعية متعددة الخطوات. وقد أظهرت النتائج على معايير بارزة تأثيرًا ملحوظًا: فباستخدام تدريب مُراقب بسيط (بدون تدريب مُسبق مستمر أو تعلم بالتعزيز)، حقق وكيّل AgentFold-30B-A3B نتائج بنسبة 36.2% في معيار BrowseComp و47.3% في BrowseComp-ZH. وتجدر الإشارة إلى أن هذه الأداء لا يفوق فقط النماذج المفتوحة المصدر ذات الحجم الأكبر بشكل كبير، مثل DeepSeek-V3.1-671B-A37B، بل يتفوّق أيضًا على أبرز الوكلاء المُلكية مثل o4-mini من OpenAI.