HyperAIHyperAI
منذ 2 أشهر

التعلم التعزيزي متعدد الأهداف: بيئات الروبوتات الصعبة وطلب البحث

Matthias Plappert; Marcin Andrychowicz; Alex Ray; Bob McGrew; Bowen Baker; Glenn Powell; Jonas Schneider; Josh Tobin; Maciek Chociej; Peter Welinder; Vikash Kumar; Wojciech Zaremba
التعلم التعزيزي متعدد الأهداف: بيئات الروبوتات الصعبة وطلب البحث
الملخص

بالطبع، يرجى تقديم النص الذي ترغب في ترجمته وسأقوم بترجمته وفقًا للمعايير المذكورة أعلاه.

التعلم التعزيزي متعدد الأهداف: بيئات الروبوتات الصعبة وطلب البحث | أحدث الأوراق البحثية | HyperAI