منذ 2 أشهر
التعلم التعزيزي متعدد الأهداف: بيئات الروبوتات الصعبة وطلب البحث
Matthias Plappert; Marcin Andrychowicz; Alex Ray; Bob McGrew; Bowen Baker; Glenn Powell; Jonas Schneider; Josh Tobin; Maciek Chociej; Peter Welinder; Vikash Kumar; Wojciech Zaremba

الملخص
بالطبع، يرجى تقديم النص الذي ترغب في ترجمته وسأقوم بترجمته وفقًا للمعايير المذكورة أعلاه.