تم البحث من خلال التشغيل الذاتي
تم اقتراح تقنية البحث الذاتي (SSP) في أكتوبر 2025 من قبل فريق بحثي من جامعة أبابا كوارك وجامعة بكين وجامعة صن يات صن. وقد نُشرت نتائج البحث ذات الصلة في ورقة بحثية. البحث عن اللعب الذاتي: دفع حدود قدرات الوكيل دون إشراف .
في لعبة البحث الذاتي (SSP)، يؤدي نموذج التعلم الموجه (LLM) دورين متناوبين: مُنشئ المشكلة وحلها. يقوم مُنشئ المشكلة بتوليد استعلامات بحث معمقة بإجابات صحيحة وقابلة للتحقق، تزداد صعوبتها تدريجيًا، بينما يحاول الحل الإجابة على الأسئلة المُولدة من خلال جولات متعددة من الاستدلال والبحث. وللتحقق من صحة كل استعلام مُولد، يجمع الباحثون جميع نتائج البحث من مسار مُنشئ المشكلة كمواد خارجية، ثم يُجرون عملية توليد مُعزز الاسترجاع (RAG) للتحقق مما إذا كان الحل قادرًا على التنبؤ بالإجابة بنجاح في ضوء جميع المعلومات اللازمة. من خلال هذا التصميم، يستطيع وكيل البحث المعمق توليد مهام تدريب عالية الجودة وحلها بشكل مستقل، مما يُلغي الحاجة إلى التعليق والتحقق اليدويين مع الحفاظ على دقة المكافآت.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.