Command Palette
Search for a command to run...
مجموعة بيانات التعلم التعزيزي URLB
URLB تعني معيار التعلم التعزيزي غير الخاضع للإشراف، وهي مجموعة بيانات التعلم التعزيزي غير الخاضع للإشراف. يتكون URLB من مرحلتين: مرحلة ما قبل التدريب بدون مكافآت ومرحلة التكيف مع المهمة اللاحقة مع مكافآت خارجية. بناءً على مجموعة DeepMind Control Suite، توفر مجموعة البيانات هذه 12 مهمة تحكم مستمرة من ثلاثة مجالات للتقييم.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.