Command Palette
Search for a command to run...
مجموعة بيانات التعلم التعزيزي URLB
URLB تعني معيار التعلم التعزيزي غير الخاضع للإشراف، وهي مجموعة بيانات التعلم التعزيزي غير الخاضع للإشراف. يتكون URLB من مرحلتين: مرحلة ما قبل التدريب بدون مكافآت ومرحلة التكيف مع المهمة اللاحقة مع مكافآت خارجية. بناءً على مجموعة DeepMind Control Suite، توفر مجموعة البيانات هذه 12 مهمة تحكم مستمرة من ثلاثة مجالات للتقييم.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.