IterResearch: إعادة التفكير في الوكلاء ذوي الأفق الطويل من خلال إعادة بناء الحالة ماركوفية

الملخص
أظهرت التطورات الحديثة في الوكلاء العميقة للبحث إمكانات واعدة لبناء المعرفة التلقائي من خلال الاستدلال الديناميكي على المصادر الخارجية. ومع ذلك، تعتمد النماذج الحالية على نموذج مفرِد السياق، حيث يتم جمع كل المعلومات في نافذة سياق واحدة متزايدة، ما يؤدي إلى ازدحام السياق وتلوثه بالضوضاء، مما يحد من فعاليتها في المهام ذات الأفق الطويل. نقدّم "IterResearch"، نموذجًا تكراريًا جديدًا للبحث العميق، يعيد صياغة البحث ذي الأفق الطويل كعملية اتخاذ قرارات ماركوفية مع إعادة بناء استراتيجية لمساحة العمل. من خلال الحفاظ على تقرير متغير كذاكرة وتصنيف دوري للرؤى، يُبقي نهجنا قدرة استدلال متسقة عبر عمق استكشاف غير محدود. ونُطوّر أيضًا إطار "التحسين الاستراتيجي المُستشعر بالكفاءة" (EAPO)، وهو إطار تعزيز تعلّمي يشجع على الاستكشاف الفعّال من خلال تناقص مكافأة هندسي، ويُمكّن من التدريب الموزع المستقر عبر تناقص تلقائي للعينات. تُظهر التجارب الواسعة أن "IterResearch" يحقق تحسينات كبيرة مقارنةً بالوكلاء المفتوحة المصدر الحالية، بزيادة متوسطة تصل إلى +14.5 نقطة مئوية عبر ستة معايير، وتمدّد الفجوة مع الأنظمة الابتكارية المُخزّنة. وبشكل ملحوظ، تُظهر نظرية "IterResearch" مرونة تفاعلية غير مسبوقة، حيث تمتد إلى 2048 تفاعلًا مع مكاسب أداء دراماتيكية (من 3.5% إلى 42.5%)، وتعمل كاستراتيجية توجيه فعّالة، مُحسّنةً النماذج الابتكارية بنسبة تصل إلى 19.2 نقطة مئوية مقارنةً بـ"ReAct" في المهام ذات الأفق الطويل. تُرسي هذه النتائج "IterResearch" كحل مرن للاستدلال ذي الأفق الطويل، فعّالًا كوكيل مدرب، وكمُنظَر توجيهي فعّال للنماذج الابتكارية.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.