HyperAIHyperAI

Command Palette

Search for a command to run...

معركة العصابات البيزية العميقة: مقارنة تجريبية للشبكات العصبية العميقة البيزية لعينة تومسون

Carlos Riquelme* George Tucker Jasper Snoek

الملخص

التطورات الحديثة في التعلم العميق بالتعزيز قد أحرزت تقدمًا كبيرًا في الأداء على التطبيقات مثل لعبة الغو (Go) وألعاب آتاري (Atari). ومع ذلك، فإن تطوير طرق عملية لموازنة الاستكشاف والاستغلال في المجالات المعقدة لا يزال مشكلة غير محلولة بشكل كبير. توفر عينة ثومسون (Thompson Sampling) وتوسيعها إلى التعلم بالتعزيز نهجًا أنيقًا للاستكشاف يتطلب فقط الوصول إلى عينات ما بعدية من النموذج. وفي الوقت نفسه، أدت التطورات في الطرق البيزية التقريبية إلى جعل تقريب ما بعد للنماذج العصبية المرنة عملية عملية. لذلك، من الجذاب النظر في استخدام الشبكات العصبية البيزية التقريبية ضمن إطار عينة ثومسون. لفهم تأثير استخدام تقريب ما بعد على عينة ثومسون، قمنا بقياس أداء الطرق المثبتة حسنًا والطرق التي تم تطويرها مؤخرًا للحصول على عينات تقريبية لما بعد مدمجة مع عينة ثومسون عبر سلسلة من مشاكل البانديت السياقية (contextual bandit problems). وقد اكتشفنا أن العديد من الأساليب التي حققت نجاحًا في إعداد التعلم الإشرافي أدّت بأداء أقل في سيناريو صنع القرار المتتابع. وبشكل خاص، نسلط الضوء على تحدي مواءمة تقديرات عدم اليقين التي تتقارب ببطء إلى الإعداد المباشر.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
معركة العصابات البيزية العميقة: مقارنة تجريبية للشبكات العصبية العميقة البيزية لعينة تومسون | مستندات | HyperAI