HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 15 أيام

IterResearch: إعادة التفكير في الوكلاء ذوي الأفق الطويل من خلال إعادة بناء الحالة ماركوفية

IterResearch: إعادة التفكير في الوكلاء ذوي الأفق الطويل من خلال إعادة بناء الحالة ماركوفية

الملخص

أظهرت التطورات الحديثة في الوكلاء العميقة للبحث إمكانات واعدة لبناء المعرفة التلقائي من خلال الاستدلال الديناميكي على المصادر الخارجية. ومع ذلك، تعتمد النماذج الحالية على نموذج مفرِد السياق، حيث يتم جمع كل المعلومات في نافذة سياق واحدة متزايدة، ما يؤدي إلى ازدحام السياق وتلوثه بالضوضاء، مما يحد من فعاليتها في المهام ذات الأفق الطويل. نقدّم "IterResearch"، نموذجًا تكراريًا جديدًا للبحث العميق، يعيد صياغة البحث ذي الأفق الطويل كعملية اتخاذ قرارات ماركوفية مع إعادة بناء استراتيجية لمساحة العمل. من خلال الحفاظ على تقرير متغير كذاكرة وتصنيف دوري للرؤى، يُبقي نهجنا قدرة استدلال متسقة عبر عمق استكشاف غير محدود. ونُطوّر أيضًا إطار "التحسين الاستراتيجي المُستشعر بالكفاءة" (EAPO)، وهو إطار تعزيز تعلّمي يشجع على الاستكشاف الفعّال من خلال تناقص مكافأة هندسي، ويُمكّن من التدريب الموزع المستقر عبر تناقص تلقائي للعينات. تُظهر التجارب الواسعة أن "IterResearch" يحقق تحسينات كبيرة مقارنةً بالوكلاء المفتوحة المصدر الحالية، بزيادة متوسطة تصل إلى +14.5 نقطة مئوية عبر ستة معايير، وتمدّد الفجوة مع الأنظمة الابتكارية المُخزّنة. وبشكل ملحوظ، تُظهر نظرية "IterResearch" مرونة تفاعلية غير مسبوقة، حيث تمتد إلى 2048 تفاعلًا مع مكاسب أداء دراماتيكية (من 3.5% إلى 42.5%)، وتعمل كاستراتيجية توجيه فعّالة، مُحسّنةً النماذج الابتكارية بنسبة تصل إلى 19.2 نقطة مئوية مقارنةً بـ"ReAct" في المهام ذات الأفق الطويل. تُرسي هذه النتائج "IterResearch" كحل مرن للاستدلال ذي الأفق الطويل، فعّالًا كوكيل مدرب، وكمُنظَر توجيهي فعّال للنماذج الابتكارية.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
IterResearch: إعادة التفكير في الوكلاء ذوي الأفق الطويل من خلال إعادة بناء الحالة ماركوفية | الأوراق البحثية | HyperAI