الملخص

أظهرت التطورات الحديثة في الوكلاء العميقة للبحث إمكانات واعدة لبناء المعرفة التلقائي من خلال الاستدلال الديناميكي على المصادر الخارجية. ومع ذلك، تعتمد النماذج الحالية على نموذج مفرِد السياق، حيث يتم جمع كل المعلومات في نافذة سياق واحدة متزايدة، ما يؤدي إلى ازدحام السياق وتلوثه بالضوضاء، مما يحد من فعاليتها في المهام ذات الأفق الطويل. نقدّم "IterResearch"، نموذجًا تكراريًا جديدًا للبحث العميق، يعيد صياغة البحث ذي الأفق الطويل كعملية اتخاذ قرارات ماركوفية مع إعادة بناء استراتيجية لمساحة العمل. من خلال الحفاظ على تقرير متغير كذاكرة وتصنيف دوري للرؤى، يُبقي نهجنا قدرة استدلال متسقة عبر عمق استكشاف غير محدود. ونُطوّر أيضًا إطار "التحسين الاستراتيجي المُستشعر بالكفاءة" (EAPO)، وهو إطار تعزيز تعلّمي يشجع على الاستكشاف الفعّال من خلال تناقص مكافأة هندسي، ويُمكّن من التدريب الموزع المستقر عبر تناقص تلقائي للعينات. تُظهر التجارب الواسعة أن "IterResearch" يحقق تحسينات كبيرة مقارنةً بالوكلاء المفتوحة المصدر الحالية، بزيادة متوسطة تصل إلى +14.5 نقطة مئوية عبر ستة معايير، وتمدّد الفجوة مع الأنظمة الابتكارية المُخزّنة. وبشكل ملحوظ، تُظهر نظرية "IterResearch" مرونة تفاعلية غير مسبوقة، حيث تمتد إلى 2048 تفاعلًا مع مكاسب أداء دراماتيكية (من 3.5% إلى 42.5%)، وتعمل كاستراتيجية توجيه فعّالة، مُحسّنةً النماذج الابتكارية بنسبة تصل إلى 19.2 نقطة مئوية مقارنةً بـ"ReAct" في المهام ذات الأفق الطويل. تُرسي هذه النتائج "IterResearch" كحل مرن للاستدلال ذي الأفق الطويل، فعّالًا كوكيل مدرب، وكمُنظَر توجيهي فعّال للنماذج الابتكارية.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Command Palette

IterResearch: إعادة التفكير في الوكلاء ذوي الأفق الطويل من خلال إعادة بناء الحالة ماركوفية

Guoxin Chen Zile Qiao Xuanzhong Chen Donglei Yu Haotian Xu Wayne Xin Zhao Ruihua Song Wenbiao Yin Huifeng Yin Liwen Zhang6 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

IterResearch: إعادة التفكير في الوكلاء ذوي الأفق الطويل من خلال إعادة بناء الحالة ماركوفية

Guoxin Chen Zile Qiao Xuanzhong Chen Donglei Yu Haotian Xu Wayne Xin Zhao Ruihua Song Wenbiao Yin Huifeng Yin Liwen Zhang6 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

IterResearch: إعادة التفكير في الوكلاء ذوي الأفق الطويل من خلال إعادة بناء الحالة ماركوفية

Guoxin Chen Zile Qiao Xuanzhong Chen Donglei Yu Haotian Xu Wayne Xin Zhao Ruihua Song Wenbiao Yin Huifeng Yin Liwen Zhang6 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Guoxin Chen Zile Qiao Xuanzhong Chen Donglei Yu Haotian Xu Wayne Xin Zhao Ruihua Song Wenbiao Yin Huifeng Yin Liwen Zhang

Guoxin Chen Zile Qiao Xuanzhong Chen Donglei Yu Haotian Xu Wayne Xin Zhao Ruihua Song Wenbiao Yin Huifeng Yin Liwen Zhang

Guoxin Chen Zile Qiao Xuanzhong Chen Donglei Yu Haotian Xu Wayne Xin Zhao Ruihua Song Wenbiao Yin Huifeng Yin Liwen Zhang