الملخص

تُظهر الوكلاء الويب القائمون على نماذج اللغة الكبيرة (LLM) أداءً قويًا في المهام التي تتطلب معرفة واسعة، لكنهم يعانون من قيود في نافذة السياق في النماذج مثل ReAct. فالاستفسارات المعقدة التي تتضمن كيانات متعددة، وعلاقات متشابكة، ودرجة عالية من عدم اليقين، تتطلب دورات بحث طويلة تُستهلك فيها ميزانية السياق بسرعة قبل الوصول إلى حلول كاملة. ول superar هذا التحدي، نقدم ReSum، نموذجًا جديدًا يمكّن من الاستكشاف غير المحدود من خلال تلخيص السياق دوريًا. يحوّل ReSum السجلات المتزايدة للتفاعل إلى حالات استنتاج مكثفة، مع الحفاظ على الوعي بالاكتشافات السابقة، مع تجاوز قيود السياق. وبالنسبة لتكيف النموذج، نقترح ReSum-GRPO، الذي يدمج بين GRPO وتدريب المسارات المُقسَّمة ونشر الميزة لتمكين الوكلاء من التعود على التفكير المعتمد على التلخيص. وقد أظهرت التجارب الواسعة على وكلاء ويب بمقاييس مختلفة عبر ثلاث معايير أن ReSum يحقق تحسنًا مطلقًا متوسطه 4.5% مقارنةً بـ ReAct، مع مكاسب إضافية تصل إلى 8.2% بعد تدريب ReSum-GRPO. وبشكل لافت، وباستخدام فقط 1000 عينة تدريب، تحقق WebResummer-30B (النسخة المدربة بـ ReSum-GRPO من WebSailor-30B) نسبة 33.3% في معيار BrowseComp-zh و18.3% في BrowseComp-en، متفوقةً على الوكلاء المفتوحة المصدر الحالية.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Command Palette

ReSum: فتح ذكاء البحث على المدى الطويل من خلال تلخيص السياق

Xixi Wu Kuan Li Yida Zhao Liwen Zhang Litu Ou Huifeng Yin Zhongwang Zhang Yong Jiang Pengjun Xie Fei Huang4 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

ReSum: فتح ذكاء البحث على المدى الطويل من خلال تلخيص السياق

Xixi Wu Kuan Li Yida Zhao Liwen Zhang Litu Ou Huifeng Yin Zhongwang Zhang Yong Jiang Pengjun Xie Fei Huang4 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

ReSum: فتح ذكاء البحث على المدى الطويل من خلال تلخيص السياق

Xixi Wu Kuan Li Yida Zhao Liwen Zhang Litu Ou Huifeng Yin Zhongwang Zhang Yong Jiang Pengjun Xie Fei Huang4 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Xixi Wu Kuan Li Yida Zhao Liwen Zhang Litu Ou Huifeng Yin Zhongwang Zhang Yong Jiang Pengjun Xie Fei Huang

Xixi Wu Kuan Li Yida Zhao Liwen Zhang Litu Ou Huifeng Yin Zhongwang Zhang Yong Jiang Pengjun Xie Fei Huang

Xixi Wu Kuan Li Yida Zhao Liwen Zhang Litu Ou Huifeng Yin Zhongwang Zhang Yong Jiang Pengjun Xie Fei Huang