HyperAIHyperAI

Command Palette

Search for a command to run...

التعلم التكاملي للأشجار القرارية القابلة للتفسير

Leonardo Lucio Custode Giovanni Iacca

الملخص

في العقد الماضي، حققت تقنيات التعلم بالتعزيز أداءً يعادل مستوى الإنسان في عدة مهام. ومع ذلك، في السنوات الأخيرة، ظهرت الحاجة إلى التفسيرية: نرغب في القدرة على فهم كيفية عمل النظام وأسباب قراراته. ليس فقط نحن بحاجة إلى التفسيرية لتقييم سلامة الأنظمة المنتجة، بل نحتاج أيضًا إليها لاستخلاص معرفة حول المشكلات غير المعروفة. وعلى الرغم من وجود بعض التقنيات التي تُحسّن أشجار القرار للتعلم بالتعزيز، إلا أنها غالبًا ما تستخدم خوارزميات جشعة أو لا تستفيد من المكافآت التي يوفرها البيئة، مما يعني أن هذه التقنيات قد تعلق بسهولة في حلول محلية غير مثلى. في هذا العمل، نقترح نهجًا جديدًا للتعلم بالتعزيز القابل للتفسير باستخدام أشجار القرار. نقدّم خطة تحسين ثنائية المستوى تدمج مزايا الخوارزميات التطورية مع مزايا تعلم Q. وبهذا نُفكك المشكلة إلى مشكلتين فرعيتين: مشكلة إيجاد تجزئة ذات معنى وفائدة لفضاء الحالة، ومشكلة ربط إجراء معين بكل حالة. وقد تم اختبار الطريقة المقترحة على ثلاث معايير معروفة في التعلم بالتعزيز، حيث أظهرت نتائج تنافسية مقارنة بالحالة الحالية من حيث الأداء والتفسيرية. وأخيرًا، نُجري دراسة تحليلية (أبليشن ستودي) تؤكد أن استخدام خطة التحسين ثنائية المستوى يُحسّن الأداء في البيئات غير البسيطة مقارنة بأسلوب التحسين ذي الطبقة الواحدة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp