HyperAIHyperAI

Command Palette

Search for a command to run...

CURL: تمثيلات غير مراقبة تباينية للتعلم التعلمي

Aravind Srinivas Michael Laskin Pieter Abbeel

الملخص

نقدم نموذج CURL: تمثيلات غير مراقبة تناقضية للتعلم التكاملي. يقوم CURL باستخراج ميزات عالية المستوى من الصور الخام باستخدام التعلم التناقضي، ثم يُطبّق التحكم غير المُعتمد على نموذج (off-policy) على الميزات المستخرجة. وقد تفوق CURL على الطرق القائمة على الصور السابقة، سواء كانت قائمة على النماذج أو غير قائمة على النماذج، في المهام المعقدة ضمن مجموعة DeepMind Control Suite وألعاب Atari، محققاً مكاسب أداء قدرها 1.9 مرة و1.2 مرة على التوالي عند نقاط المقارنة المتمثلة في 100 ألف خطوة بيئية وخطوات تفاعل. وفي مجموعة DeepMind Control Suite، أصبح CURL أول خوارزمية تعتمد على الصور تقترب من كفاءة الاستخدام العيني (sample-efficiency) للطرق التي تعتمد على ميزات الحالة (state-based features). وتم إتاحة الكود المصدر للنموذج عبر الرابط التالي: https://github.com/MishaLaskin/curl.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp