HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 2 أشهر

توسيع الوكالات من خلال التدريب المستمر

توسيع الوكالات من خلال التدريب المستمر

الملخص

تطورت النماذج اللغوية الكبيرة (LLMs) إلى أنظمة عاملة قادرة على استخدام أدوات تلقائية والتفكير متعدد الخطوات لحل المشكلات المعقدة. ومع ذلك، تُظهر النماذج التي تُدرَّب بعد التدريب الأولي، والتي تعتمد على النماذج الأساسية العامة، أداءً ضعيفًا باستمرار في المهام العاملة، خصوصًا في النسخ المفتوحة المصدر. نحدد السبب الجذري: غياب النماذج الأساسية العاملة القوية، ما يُجبر النماذج أثناء التدريب اللاحق على تعلُّم سلوكيات عاملة متنوعة في آنٍ واحد، مع محاذاة هذه السلوكيات إلى أمثلة الخبراء، مما يخلق تناقضات أساسية في عملية التحسين. ولحل هذه المشكلة، نُقدِّم لأول مرة دمج عملية التدريب المُستمر العامل (Agentic Continual Pre-training - Agentic CPT) في خط أنابيب تدريب الوكلاء العاملين العميقين، بهدف بناء نماذج أساسية عاملة قوية. واستنادًا إلى هذا النهج، نُطوِّر نموذجًا عاملًا عميقًا للبحث يُسمَّى AgentFounder. وقد قُمنا بتقييم نموذج AgentFounder-30B على 10 معايير، وحقق أداءً يُصنَّف ضمن أفضل الأداء في المجال، مع الحفاظ على قدرة قوية على استخدام الأدوات، حيث بلغت النتائج 39.9% في BrowseComp-en، و43.3% في BrowseComp-zh، و31.5% في Pass@1 على HLE.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
توسيع الوكالات من خلال التدريب المستمر | الأوراق البحثية | HyperAI