HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 8 أيام

DeepAgent: وكيل استنتاج عام يمتلك مجموعات أدوات قابلة للتوسع

DeepAgent: وكيل استنتاج عام يمتلك مجموعات أدوات قابلة للتوسع

الملخص

أظهرت النماذج الكبيرة للاستنتاج قدرات قوية في حل المشكلات، ومع ذلك فإن المهام الواقعية غالبًا ما تتطلب استخدام أدوات خارجية وتفاعلات متعددة على مدى زمني طويل. تلتزم الإطارات الحالية للوكالات عادةً بمسارات عمل محددة مسبقًا، مما يحد من إمكانية إنجاز المهام بشكل مستقل وشامل. في هذه الورقة، نقدم DeepAgent، وهو وكيل استنتاج عميق من الطرف إلى الطرف، قادر على أداء التفكير المستقل، واكتشاف الأدوات، وتنفيذ الإجراءات ضمن عملية استنتاج واحدة متماسكة ومتسلسلة. وللتغلب على التحديات المرتبطة بالتفاعلات الطويلة المدى، وخاصة انفجار طول السياق الناتج عن الاستدعاءات المتعددة للأدوات وتراكم سجل التفاعلات، نقدّم آلية تلقائية لطي الذاكرة، تُختزل من خلالها التفاعلات السابقة إلى ذاكرات منظمة من نوعين: ذاكرة حدثية، وذاكرة عمل، وذاكرة أدوات، مما يقلل من تراكم الأخطاء مع الحفاظ على المعلومات الأساسية. ولتعليم استخدام الأدوات العامة بكفاءة واستقرار، نطور استراتيجية تعلم تعزيزية من الطرف إلى الطرف، تُسمى ToolPO، والتي تعتمد على واجهات برمجة تطبيقات (APIs) مُحاكاة بواسطة نماذج اللغة الكبيرة (LLMs)، وتطبق تخصيص الفائدة لاستدعاءات الأدوات لتوزيع الائتمان بدقة على عناصر استدعاء الأدوات. أظهرت التجارب الواسعة على ثمانية معايير، تشمل مهام استخدام أدوات عامة (ToolBench، API-Bank، TMDB، Spotify، ToolHop) والتطبيقات اللاحقة (ALFWorld، WebShop، GAIA، HLE)، أن DeepAgent يتفوق باستمرار على النماذج الأساسية في كل من سيناريوهات استرجاع الأدوات ذات التسميات المحددة وسيناريوهات استرجاع الأدوات المفتوحة. تمثل هذه الدراسة خطوة نحو تطوير وكالات أكثر شمولية وقدرة لتطبيقات العالم الحقيقي. يُتاح الكود والعرض التوضيحي على الرابط: https://github.com/RUC-NLPIR/DeepAgent.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
DeepAgent: وكيل استنتاج عام يمتلك مجموعات أدوات قابلة للتوسع | الأوراق البحثية | HyperAI