Command Palette
Search for a command to run...

الملخص
شهدت منظومة النماذج اللغوية الكبيرة (LLMs) تحوّلاً متزايداً نحو التطبيقات الوظيفية (agentic)، حيث أصبحت قدرة التصفح عبر الويب عنصراً أساسياً لاسترجاع المعلومات من مصادر متعددة على الإنترنت. ومع ذلك، فإن الوكلاء المفتوحي المصدر للويب الحاليين إما يُظهرون قدرات محدودة في البحث عن المعلومات في المهام المعقدة، أو يفتقرون إلى عمليات تطبيقية شفافة. في هذا العمل، نحدد أن التحدي الرئيسي يكمن في ندرة البيانات الصعبة المستخدمة في مهام البحث عن المعلومات. وللتغلب على هذه القيود، نقدّم "WebExplorer": منهجية منظمة لإنشاء البيانات باستخدام استكشاف مبني على النماذج، وتطوير استفسارات تدريجيًا من الطويل إلى القصير. يُنتج هذا الأسلوب أزواج استفسار-إجابة صعبة تتطلب تفكيراً متعدد الخطوات وتنقلًا معقدًا عبر الويب. وباستخدام مجموعة البيانات عالية الجودة التي قمنا بتحديثها، نجحنا في تطوير وكيل ويب متقدم يُسمى WebExplorer-8B من خلال التدريب المُحسّن تحت الإشراف، تلاه التعلّم المعزّز. يدعم نموذجنا طول سياق يصل إلى 128 ألف كلمة، ويدعم حتى 100 دورة استدعاء أدوات، مما يمكّنه من حل المشكلات ذات المدى الطويل. وتمثّل WebExplorer-8B الأداء الأفضل على مستوى حجمها في مجموعة متنوعة من معايير البحث عن المعلومات. وبشكل لافت، وبما أن النموذج بحجم 8B، فقد أظهر قدرة فعّالة على البحث عبر متوسط 16 دورة بعد التدريب بالتعلم المعزز، محققاً دقة أعلى من WebSailor-72B في معايير BrowseComp-en/zh، وحقق أفضل أداء بين جميع النماذج حتى 100B من المعاملات في معيار WebWalkerQA وFRAMES. وبالإضافة إلى هذه المهام الخاصة بالبحث عن المعلومات، حقق نموذجنا أداءً قوياً في التعميم على معيار HLE، رغم أن تدريبه تم فقط على بيانات مسائل الاستجابة المبنية على المعرفة. تُبرز هذه النتائج منهجنا كمسار عملي وواقعي نحو تطوير وكلاء ويب ذات مدى طويل.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.