HyperAIHyperAI

Command Palette

Search for a command to run...

Console

تم البحث من خلال التشغيل الذاتي

التاريخ

منذ 4 أيام

المؤسسة

جامعة بكين
جامعة صن يات صن

رابط الورقة البحثية

2510.18821

العلامات

تم اقتراح تقنية البحث الذاتي (SSP) في أكتوبر 2025 من قبل فريق بحثي من جامعة أبابا كوارك وجامعة بكين وجامعة صن يات صن. وقد نُشرت نتائج البحث ذات الصلة في ورقة بحثية. البحث عن اللعب الذاتي: دفع حدود قدرات الوكيل دون إشراف .

في لعبة البحث الذاتي (SSP)، يؤدي نموذج التعلم الموجه (LLM) دورين متناوبين: مُنشئ المشكلة وحلها. يقوم مُنشئ المشكلة بتوليد استعلامات بحث معمقة بإجابات صحيحة وقابلة للتحقق، تزداد صعوبتها تدريجيًا، بينما يحاول الحل الإجابة على الأسئلة المُولدة من خلال جولات متعددة من الاستدلال والبحث. وللتحقق من صحة كل استعلام مُولد، يجمع الباحثون جميع نتائج البحث من مسار مُنشئ المشكلة كمواد خارجية، ثم يُجرون عملية توليد مُعزز الاسترجاع (RAG) للتحقق مما إذا كان الحل قادرًا على التنبؤ بالإجابة بنجاح في ضوء جميع المعلومات اللازمة. من خلال هذا التصميم، يستطيع وكيل البحث المعمق توليد مهام تدريب عالية الجودة وحلها بشكل مستقل، مما يُلغي الحاجة إلى التعليق والتحقق اليدويين مع الحفاظ على دقة المكافآت.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp