منذ 6 أشهر

الملخص

في العقد الماضي، حققت تقنيات التعلم بالتعزيز أداءً يعادل مستوى الإنسان في عدة مهام. ومع ذلك، في السنوات الأخيرة، ظهرت الحاجة إلى التفسيرية: نرغب في القدرة على فهم كيفية عمل النظام وأسباب قراراته. ليس فقط نحن بحاجة إلى التفسيرية لتقييم سلامة الأنظمة المنتجة، بل نحتاج أيضًا إليها لاستخلاص معرفة حول المشكلات غير المعروفة. وعلى الرغم من وجود بعض التقنيات التي تُحسّن أشجار القرار للتعلم بالتعزيز، إلا أنها غالبًا ما تستخدم خوارزميات جشعة أو لا تستفيد من المكافآت التي يوفرها البيئة، مما يعني أن هذه التقنيات قد تعلق بسهولة في حلول محلية غير مثلى. في هذا العمل، نقترح نهجًا جديدًا للتعلم بالتعزيز القابل للتفسير باستخدام أشجار القرار. نقدّم خطة تحسين ثنائية المستوى تدمج مزايا الخوارزميات التطورية مع مزايا تعلم Q. وبهذا نُفكك المشكلة إلى مشكلتين فرعيتين: مشكلة إيجاد تجزئة ذات معنى وفائدة لفضاء الحالة، ومشكلة ربط إجراء معين بكل حالة. وقد تم اختبار الطريقة المقترحة على ثلاث معايير معروفة في التعلم بالتعزيز، حيث أظهرت نتائج تنافسية مقارنة بالحالة الحالية من حيث الأداء والتفسيرية. وأخيرًا، نُجري دراسة تحليلية (أبليشن ستودي) تؤكد أن استخدام خطة التحسين ثنائية المستوى يُحسّن الأداء في البيئات غير البسيطة مقارنة بأسلوب التحسين ذي الطبقة الواحدة.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Leonardo Lucio Custode Giovanni Iacca

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Leonardo Lucio Custode Giovanni Iacca

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Leonardo Lucio Custode Giovanni Iacca

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

التعلم التكاملي للأشجار القرارية القابلة للتفسير

Leonardo Lucio Custode Giovanni Iacca

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

التعلم التكاملي للأشجار القرارية القابلة للتفسير

Leonardo Lucio Custode Giovanni Iacca

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

التعلم التكاملي للأشجار القرارية القابلة للتفسير

Leonardo Lucio Custode Giovanni Iacca

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters